OpenPDFTools

Tukarkan PDF ke Excel Dalam Talian Percuma

Ekstrak teks dan data tabular daripada fail PDF dan tukarkan ke hamparan Excel (.xlsx). ⚡ Alat ini menganalisis tata letak teks untuk mengesan baris dan lajur, menjadikannya mudah untuk anda bekerja dengan data PDF dalam hamparan.

Letakkan fail di sini atau klik untuk menelusuri

Hingga 200 MB per fail - diproses secara lokal

Cara Kerjanya

1

Muat naik fail PDF anda

2

Jadual dikesan dan diekstrak secara automatik

3

Muat turun hamparan Excel anda (.xlsx)

Bagaimana Penukaran PDF ke Excel Berfungsi?

Penukaran PDF ke Excel mengekstrak teks daripada dokumen anda, menganalisis tata letak spasial untuk mengesan baris dan lajur, dan membuat hamparan .xlsx yang berstruktur. Alat ini mengenal pasti data tabular dengan memeriksa bagaimana elemen teks diposisikan pada setiap halaman. Elemen pada garis mendatar yang sama menjadi satu baris, dan jarak konsisten di antara kumpulan mendefinisikan sempadan lajur.

Saluran ekstraksi berjalan sepenuhnya dalam pelayar anda. PDF.js membaca dokumen dan mengembalikan item teks dengan koordinat x/y. Kod analisis tata letak kami mengumpulkan item ini menjadi baris dan lajur berdasarkan kedudukannya. Perpustakaan xlsx kemudian membuat hamparan dengan struktur yang dikesan. Untuk jadual yang diformatkan dengan baik dengan jarak lajur yang jelas, ketepatan pengesanan biasanya di atas 90%. Jadual kompleks dengan sel yang digabungkan atau jarak tidak teratur mungkin memerlukan penyesuaian manual.

Data yang orang kerap ekstrak daripada PDF ke hamparan:

  • Laporan kewangan dan penyata suku tahunan dengan jadual pendapatan
  • Item baris invois dengan nama produk, kuantiti, dan harga
  • Helaian nilai akademik dan catatan pelajar daripada portal universiti
  • Katalog produk dengan spesifikasi yang disusun dalam lajur
  • Laporan statistik kerajaan dengan data demografi atau ekonomi dalam jadual

Perkhidmatan ekstraksi awan menggunakan algoritma yang lebih canggih (kadang-kadang termasuk AI) dan boleh menangani tata letak jadual yang lebih tidak rapi. Kos adalah memuat naik laporan kewangan atau data klien anda ke pelayan yang tidak anda kawal. Untuk jadual langsung dengan jarak lajur teratur, ekstraksi berasaskan pelayar kami menyamai kualiti awan. Untuk laporan kompleks dengan jadual bersarang, anda mungkin perlu menyesuaikan keluaran hamparan secara manual.

Jika PDF anda mengandungi terutamanya teks daripada jadual, PDF ke Word ialah pilihan yang lebih sesuai. Setelah mengekstrak data ke Excel, anda mungkin ingin memisahkan PDF asli untuk menyimpan hanya halaman yang relevan, atau memampatkannya sebelum mengarsipkan.

Mengapa OpenPDFTools?

100% Peribadi

Fail Anda tidak pernah meninggalkan peranti Anda. Semua pemrosesan terjadi secara lokal di pelayar Anda menggunakan teknologi WebAssembly. Nol pengumpulan data, nol risiko privasi.

Sepenuhnya Percuma

Tidak perlu pendaftaran. Tidak ada biaya tersembunyi. Tidak ada batas fail. Tidak ada watermark. Hanya alat yang Anda butuhkan, kapan pun Anda membutuhkannya.

Secepat Kilat

Tidak ada waktu tunggu muat naik/muat turun. Fail diproses secara instan di peranti Anda. Bahkan fail besar ditangani dalam hitungan detik.

Pertanyaan yang Sering Diajukan

Bagaimana pengesanan jadual berfungsi?
Alat ini mengekstrak teks daripada PDF dan menganalisis kedudukan spasial setiap elemen teks. Elemen pada garis mendatar yang sama menjadi satu baris, dan jarak di antara elemen mendefinisikan sempadan lajur. Ini berfungsi dengan baik untuk jadual yang diformatkan dengan jelas.
Adakah jadual kompleks akan ditukar dengan tepat?
Alat ini berfungsi paling baik dengan jadual yang ringkas dan berstruktur dengan baik. Jadual kompleks dengan sel yang digabungkan, jadual bersarang, atau tata letak tidak teratur mungkin tidak ditukar dengan sempurna. Anda mungkin perlu menyesuaikan hamparan secara manual setelah penukaran.
Bolehkah saya menukar PDF dengan beberapa jadual?
Ya. Semua kandungan teks daripada semua halaman diekstrak ke satu hamparan. Jadual daripada halaman yang berbeza akan muncul sebagai baris berurutan. Anda kemudian boleh memisahkannya mengikut keperluan dalam aplikasi hamparan anda.
Bagaimana dengan jadual PDF hasil imbasan?
PDF imbasan yang mengandungi gambar jadual tidak boleh diproses oleh alat ini, kerana tiada teks yang boleh diekstrak. Anda memerlukan perisian OCR untuk menukar gambar imbasan menjadi teks terlebih dahulu.
Format hamparan apa yang digunakan?
Outputnya ialah fail .xlsx (format Spreadsheet Office Open XML), serasi dengan Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers, dan kebanyakan aplikasi hamparan lain.

Alat Terkait