OpenPDFTools

Конвертирайте PDF в Excel онлайн безплатно

⚡ Извличайте текстови и таблични данни от PDF файлове и ги конвертирайте в електронни таблици на Excel (.xlsx). Инструментът анализира оформлението на текста, за да открие редове и колони, което улеснява работата с PDF данни в табличен формат.

Плъзнете файлове тук или щракнете, за да изберете

До 200 MB на файл - обработката се извършва локално

Как става това

1

Качете вашия PDF файл

2

Таблиците се откриват и извличат автоматично

3

Изтеглете вашата електронна таблица в Excel (.xlsx)

Как работи конвертирането на PDF към Excel?

Конверторът на PDF към Excel извлича текст от вашия документ, анализира пространственото оформление, за да открие редове и колони, и създава структурирана .xlsx електронна таблица. Инструментът идентифицира таблични данни, като изследва подредбата на текстовите елементи на всяка страница. Елементите на една и съща хоризонтална линия стават ред ипостоянното разстояние между групите определя границите на колоните.

Тръбопроводът за извличане работи изцяло във вашия браузър. PDF.js чете документа и връща текстови елементи с координати x/y. Нашият код за анализ на оформлението групира тези елементи в редове и колони въз основа на техните позиции. След това библиотеката xlsx създава електронна таблица с откритата структура. За добре форматирани таблици с ясно разстояние между колонитеточността обикновено надвишава 90%. Сложните таблици с обединени клетки или неправилно разстояние може да изискват ръчни корекции.

Данни, които хората редовно извличат от PDF файлове в електронни таблици:

  • Финансови отчети и тримесечни обобщения с таблици на приходите
  • Фактурни елементи с имена на артикули, количества и цени
  • Академични справки и студентски досиета от университетски портали
  • Продукт каталози със спецификации, организирани в колони
  • Правителствени статистически отчети с таблици с демографски или икономически данни

Услугите за извличане в облак използват по-сложни алгоритми (понякога включващи AI) и могат да обработват по-малко структурирани таблици. Цената на това е качването на вашите финансови отчети или клиентски данни на сървър, който не контролирате. За прости таблици с редовно разстояние между колоните, нашето извличане, базирано на браузър, е с качество в облак. За сложни отчети с вложени таблици може да се наложи ръчно да коригирате резултата.

Ако вашият PDF съдържа предимно текст, а не таблици, PDF към Word ще работи по-добре. След като извлечете данните в Excel, можете да разделите оригиналния PDF, за да запазите само съответните страници, или да го компресирате преди архивиране.

Защо OpenPDFTools?

100% конфиденциалност

Вашите файлове никога не напускат вашето устройство. Цялата обработка се извършва локално във вашия браузър с помощта на технологията WebAssembly. Без събиране на данни, без риск за поверителността.

Напълно безплатно

Не се изисква регистрация. Без скрити такси. Няма ограничения за файловете. Без водни знаци. Само инструментите, от които се нуждаете, когато имате нужда от тях.

Светкавична скорост

Без чакане за зареждане или изтегляне. Файловете се обработват незабавно на вашето устройство. Дори големи файлове се обработват за секунди.

Често задавани въпроси

Как работи дефиницията на таблицата?
Инструментът извлича текст от PDF ианализира пространственото разположение на всеки текстов елемент. Елементите на една и съща хоризонтална линия стават ред, а разстоянието между елементите определя границите на колоните. Работи най-добре с ясно форматирани таблици.
Сложните таблици ще бъдат ли преобразувани точно?
Инструментът работи най-добре с прости, добре структурирани таблици. Сложните таблици с обединени клетки, вложени таблици или неправилно оформление може да не се конвертират перфектно. Може да се наложи ръчно да коригирате таблицата след преобразуването.
Възможно ли е да конвертирате PDF с множество таблици?
да Цялото текстово съдържание от всички страници се извлича в една електронна таблица. Таблици от различни страници ще се показват като последователни редове. След това можете да ги разделите според нуждите във вашия редактор на електронни таблици.
Какво ще кажете за сканирани PDF таблици?
Сканираните PDF файлове, съдържащи изображения на таблици, не могат да бъдат обработени от този инструмент, защото не съдържат извличащ се текст. Първо, ще ви е необходим OCR софтуер, за да конвертирате вашите сканирани изображения в текст.
Какъв формат на електронната таблица се използва?
Резултатът е .xlsx файл (формат на Office Open XML Spreadsheet)съвместим с Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers и повечето други приложения за електронни таблици.

Подобни инструменти