OpenPDFTools

បំលែង PDF ទៅ Excel (Convert PDF to Excel) ដោយឥតគិតថ្លៃ

⚡ ស្រង់ចេញ (extract) អត្ថបទ និងទិន្នន័យតារាង (tabular data) ពីឯកសារ PDF ហើយបំលែងពួកវាទៅជា Excel spreadsheets (.xlsx)។ ឧបករណ៍នេះវិភាគប្លង់ (layout) អត្ថបទ ដើម្បីរកឃើញជួរដេក និងជួរឈរ (rows and columns) ធ្វើឱ្យការធ្វើការជាមួយទិន្នន័យ PDF ក្នុង spreadsheet មានភាពងាយស្រួល។

ទម្លាក់ឯកសារទីនេះ ឬចុចដើម្បីរុករក

រហូតដល់ ២០០ MB ក្នុងមួយឯកសារ - ដំណើរការក្នុងស្រុក

របៀបដំណើរការ

1

បញ្ចូលឯកសារ PDF របស់អ្នក

2

តារាង (tables) ត្រូវបានរកឃើញ និងស្រង់ចេញដោយស្វ័យប្រវត្តិ

3

ទាញយក Excel spreadsheet (.xlsx) របស់អ្នក

របៀបដែលការបំលែង PDF ទៅ Excel (PDF to Excel Conversion) ដំណើរការ?

ការបំលែង PDF ទៅ Excel (PDF to Excel conversion) ស្រង់ចេញអត្ថបទពីឯកសារ វិភាគប្លង់ (spatial layout) ដើម្បីរកឃើញជួរដេក និងជួរឈរ (rows and columns) ហើយបង្កើត spreadsheet .xlsx ដែលមានរចនាសម្ព័ន្ធ។ ឧបករណ៍រកឃើញទិន្នន័យតារាង (tabular data) ដោយពិនិត្យមើលថាធាតុអត្ថបទ (text elements) ត្រូវបានដាក់ទីតាំងយ៉ាងណានៅលើគ្រប់ទំព័រ។ ធាតុដែលស្ថិតនៅលើបន្ទាត់ (horizontal line) ដូចគ្នា ក្លាយជាជួរដេក (row) ហើយចន្លោះ (spacing) ស្ថិរភាពរវាងក្រុម កំណត់ព្រំដែនជួរឈរ (column boundaries)។

ម៉ាស៊ីននៃការស្រង់ចេញ (extraction pipeline) ដំណើរការទាំងស្រុងក្នុង browser (កម្មវិធីរុករក) របស់អ្នក។ PDF.js អានឯកសារ ហើយប្រគល់ធាតុអត្ថបទជាមួយកូអរដោណេ (coordinates) x/y។ កូដ (code) វិភាគប្លង់ (layout analysis) របស់យើងដាក់ជាក្រុមធាតុទាំងនេះទៅជាជួរដេក និងជួរឈរ (rows and columns) ដោយផ្អែកលើទីតាំងរបស់ពួកវា។ បណ្ណាល័យ xlsx បន្ទាប់មកបង្កើត spreadsheet ជាមួយរចនាសម្ព័ន្ធដែលបានរកឃើញ។ សម្រាប់តារាងដែលមានទ្រង់ទ្រាយ (formatted) ល្អ ជាមួយចន្លោះ (spacing) ជួរឈរច្បាស់លាស់ ភាពត្រឹមត្រូវ (accuracy) នៃការរកឃើញជាធម្មតានៅលើ 90%។ តារាងស្មុគស្មាញ ជាមួយក្រឡារួម (merged cells) ឬចន្លោះ (spacing) មិនទៀងទាត់ ប្រហែលត្រូវការការកែប្រែដោយដៃ (manual adjustment)។

ទិន្នន័យដែលមនុស្សជាទៀងទាត់ស្រង់ចេញពី PDF ទៅ spreadsheets:

  • របាយការណ៍ហិរញ្ញវត្ថុ (financial statements) និងរបាយការណ៍ត្រីមាស (quarterly reports) ជាមួយតារាងប្រាក់ចំណូល
  • ធាតុបន្ទាត់វិក្កយបត្រ (invoice line items) ជាមួយឈ្មោះផលិតផល ចំនួន និងតម្លៃ
  • ផ្ទាំងចំណាត់ (grade sheets) និងកំណត់ត្រាសិស្ស (student records) ពីវិបផតថល (portals) សកលវិទ្យាល័យ
  • កាតាឡុក (catalogs) ផលិតផល ជាមួយលក្ខណៈបច្ចេកទេស (specifications) ដែលរៀបចំជាជួរឈរ
  • របាយការណ៍ស្ថិតិ (statistical reports) រដ្ឋាភិបាល ជាមួយតារាងទិន្នន័យប្រជាសាស្ត្រ (demographic) ឬសេដ្ឋកិច្ច (economic)

សេវាស្រង់ចេញពពក (cloud extraction services) ប្រើក្បួនដោះស្រាយ (algorithms) ដែលប្រសើរជាង - ពេលខ្លះរួមមាន AI - ហើយអាចដោះស្រាយប្លង់ (layouts) តារាងច្របូកច្របល់ (messier table layouts)។ ថ្លៃដើមគឺការបញ្ចូលរបាយការណ៍ហិរញ្ញវត្ថុ ឬទិន្នន័យអតិថិជនរបស់អ្នក ទៅម៉ាស៊ីនបម្រើ (server) ដែលអ្នកមិនត្រួតពិនិត្យ។ សម្រាប់តារាងដែលងាយស្រួល ជាមួយចន្លោះ (spacing) ជួរឈរទៀងទាត់ ការស្រង់ចេញ browser-based របស់យើងប្រៀបធៀបបានជាមួយ cloud។ សម្រាប់របាយការណ៍ស្មុគស្មាញ ជាមួយតារាងដែលដាក់ជួរ (nested tables) អ្នកប្រហែលត្រូវការកែប្រែ (adjust) លទ្ធផល spreadsheet ដោយដៃ (manually)។

ប្រសិនបើ PDF របស់អ្នកមានអត្ថបទជាចម្បង ជាជាងតារាង PDF ទៅ Word (PDF to Word) ជាការជ្រើសរើសសមស្រប (better fit)។ បន្ទាប់ពីស្រង់ចេញទិន្នន័យទៅ Excel អ្នកប្រហែលចង់ ចែក (split) PDF ដើម ដើម្បីរក្សាតែទំព័រពាក់ព័ន្ធ ឬ បង្ហាប់ (compress) វា មុននឹងរក្សាទុក។

ហេតុអ្វីបានជា OpenPDFTools?

ឯកជន ១០០%

ឯកសាររបស់អ្នកមិនចាកចេញពីឧបករណ៍អ្នកឡើយ។ ដំណើរការទាំងអស់កើតឡើងក្នុងស្រុក (locally) ក្នុងកម្មវិធីរុករករបស់អ្នក ដោយប្រើបច្ចេកវិទ្យា WebAssembly។ គ្មានការប្រមូលទិន្នន័យ, គ្មានហានិភ័យឯកជនភាព។

ឥតគិតថ្លៃទាំងស្រុង

គ្មានការចុះឈ្មោះ។ គ្មានថ្លៃលាក់កំបាំង។ គ្មានដែនកំណត់ឯកសារ។ គ្មានចំណារ (watermark)។ គ្រាន់តែឧបករណ៍ដែលអ្នកត្រូវការ, នៅពេលអ្នកត្រូវការ។

លឿនខ្លាំង

គ្មានពេលរង់ចាំការបញ្ជូន/ទាញយក (upload/download)។ ឯកសារត្រូវបានដំណើរការភ្លាមៗនៅលើឧបករណ៍របស់អ្នក។ សូម្បីឯកសារធំក៏ដំណើរការបានក្នុងតែប៉ុន្មានវិនាទី។

សំណួរដែលសួរញឹកញាប់

តើការរកឃើញតារាង (table detection) ដំណើរការយ៉ាងដូចម្ដេច?
ឧបករណ៍ស្រង់ចេញអត្ថបទពី PDF ហើយ វិភាគទីតាំង (spatial positioning) នៃធាតុអត្ថបទ (text elements) នីមួយៗ។ ធាតុដែលស្ថិតនៅលើបន្ទាត់ (horizontal line) ដូចគ្នា ក្លាយជាជួរដេក (row) ហើយចន្លោះ (spacing) រវាងធាតុ កំណត់ព្រំដែនជួរឈរ (column boundaries)។ វានេះដំណើរការបានល្អសម្រាប់តារាងដែលមានទ្រង់ទ្រាយ (formatted) ច្បាស់លាស់។
តើតារាងស្មុគស្មាញ (complex tables) នឹងបំលែងបានត្រឹមត្រូវដែរឬទេ?
ឧបករណ៍ ដំណើរការបានល្អបំផុតជាមួយតារាងដែលមានរចនាសម្ព័ន្ធច្បាស់ (simple, well-structured tables)។ តារាងស្មុគស្មាញ ជាមួយក្រឡារួម (merged cells) តារាងដែលដាក់ជួរ (nested tables) ឬប្លង់ (layouts) មិនទៀងទាត់ ប្រហែលមិនបំលែងបានល្អឥតខ្ចោះ។ អ្នកប្រហែលត្រូវការកែប្រែ (adjust) spreadsheet ដោយដៃ (manually) បន្ទាប់ពីការបំលែង។
តើខ្ញុំអាចបំលែង PDF ដែលមានតារាងច្រើន (multiple tables) បានទេ?
បាទ/ចាស។ មាតិកាអត្ថបទទាំងអស់ ពីគ្រប់ទំព័រ ត្រូវបានស្រង់ចេញទៅជា spreadsheet តែមួយ។ តារាងពីទំព័រផ្សេងៗ នឹងបង្ហាញជាជួរដេក (rows) ជាប់គ្នា។ អ្នកអាចបំបែក (separate) ពួកវាតាមតម្រូវការ ក្នុង spreadsheet application របស់អ្នក។
ចុះ PDF ដែលបានស្កែន (scanned PDFs) ដែលមានតារាងជារូបភាព?
PDF ដែលបានស្កែន ដែលមានរូបភាពនៃតារាង មិនអាចដំណើរការដោយឧបករណ៍នេះបានទេ (cannot be processed by this tool) ដោយសារគ្មានអត្ថបទ (text) ដែលអាចស្រង់ចេញបាន។ អ្នកនឹងត្រូវការកម្មវិធី OCR ដើម្បីបំលែងរូបភាពដែលបានស្កែនទៅជាអត្ថបទជាមុន។
តើទម្រង់ spreadsheet ណាដែលត្រូវបានប្រើ?
លទ្ធផលគឺជា ឯកសារ .xlsx (Office Open XML Spreadsheet format) ដែលត្រូវគ្នាជាមួយ Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers, និង spreadsheet applications ភាគច្រើនទៀត។

ឧបករណ៍ពាក់ព័ន្ធ