OpenPDFTools

Muunna PDF Excel-muotoon ilmaiseksi verkossa

Poimi teksti- ja taulukkodata PDF-tiedostoista ja muunna se Excel-laskentataulukoksi (.xlsx). Työkalu analysoi tekstin asettelun tunnistaakseen rivit ja sarakkeet, mikä helpottaa PDF-datan käsittelyä taulukkolaskentaohjelmassa. ⚡

Pudota tiedostot tähän tai napsauta selaamista varten

Enintään 200 MB tiedostoa kohti - käsitellään paikallisesti

Kuinka se toimii

1

Lataa PDF-tiedostosi

2

Taulukot tunnistetaan ja poimitaan automaattisesti

3

Lataa Excel-laskentataulukkosi (.xlsx)

Miten PDF-Excel-muunnos toimii?

PDF-Excel-muunnos poimii tekstin asiakirjastasi, analysoi paikkatietojen perusteella asettelun tunnistaakseen rivit ja sarakkeet ja luo rakenteisen .xlsx-laskentataulukon. Työkalu tunnistaa taulukkomuotoisen datan tutkimalla, miten tekstielementit on sijoitettu kullekin sivulle. Samalla vaakalinjalla olevista elementeistä tulee rivi, ja johdonmukainen välistys ryhmien välillä määrittelee sarakerajat.

Poimintaputki ajetaan kokonaan selaimessasi. PDF.js lukee asiakirjan ja palauttaa tekstielementit x/y-koordinaatein. Asetteluanalyysikoodimme ryhmittelee nämä elementit riveiksi ja sarakkeiksi niiden sijaintien perusteella. Xlsx-kirjasto luo sitten laskentataulukon tunnistetulla rakenteella. Hyvin muotoilluille taulukoille, joissa on selkeä sarakevälistys, tunnistustarkkuus on tyypillisesti yli 90 %. Monimutkaiset taulukot, joissa on yhdistettyjä soluja tai epäsäännöllistä välistystä, saattavat vaatia manuaalista säätöä.

Dataa, jota ihmiset säännöllisesti poimivat PDF-tiedostoista laskentataulukoihin:

  • Tilinpäätökset ja vuosineljännesraportit tuottotaulukoineen
  • Laskujen rivitiedot tuotenimikkein, määrin ja hintoin
  • Arvosanaluettelot ja opiskelijatiedot yliopistojen portaaleista
  • Tuoteluettelot teknisine tietoineen sarakkeissa
  • Viranomaisten tilastoraportit väestö- tai talouskäyristä

Pilvipohjaiset poimintapalvelut käyttävät kehittyneempiä algoritmeja (joskus tekoälyä) ja pystyvät käsittelemään sotkuisempia taulukkoasetteluja. Hintana on tilinpäätöstesi tai asiakasdatasi lataaminen palvelimelle, jota et hallitse. Suoraviivaisille taulukoille, joissa on säännöllinen sarakevälistys, selainpohjainen poimintamme vastaa pilvipalveluiden laatua. Monimutkaisille raporteille, joissa on sisäkkäisiä taulukoita, saatat joutua säätämään laskentataulukon tulostetta manuaalisesti.

Jos PDF sisältää pääasiassa tekstiä taulukoiden sijaan, PDF Wordiksi -muunnos sopii paremmin. Datan poimimisen jälkeen Exceliin saatat haluta jakaa alkuperäisen PDF:n säilyttääksesi vain oleelliset sivut tai pakata sen ennen arkistointia.

Miksi OpenPDFTools?

100 % yksityinen

Tiedostosi eivät koskaan jätä laitettasi. Kaikki käsittely tapahtuu paikallisesti selaimessasi WebAssembly-tekniikalla. Nolla tietokeräystä, nolla yksityisyyden riskiä.

Täysin ilmainen

Ei rekisteröintiä vaadittu. Ei piilotettuja maksuja. Ei tiedostoraja. Ei vesileimauksia. Vain työkalut, joita tarvitset, silloin kun tarvitset ne.

Salamannopea

Ei lataus-/latausodotusaikoja. Tiedostot käsitellään välittömästi laitteellasi. Jopa suuret tiedostot käsitellään sekunteissa.

Usein kysytyt kysymykset

Miten taulukon tunnistus toimii?
Työkalu poimii tekstin PDF:stä ja analysoi jokaisen tekstielementin paikkatiedon. Samalla vaakalinjalla olevista elementeistä tulee rivi, ja elementtien välinen välistys määrittelee sarakerajat. Tämä toimii hyvin selkeästi muotoilluille taulukoille.
Muuntuvatko monimutkaiset taulukot tarkasti?
Työkalu toimii parhaiten yksinkertaisilla, hyvin jäsennellyillä taulukoilla. Monimutkaiset taulukot, joissa on yhdistettyjä soluja, sisäkkäisiä taulukoita tai epäsäännöllisiä asetteluja, eivät välttämättä muunnu täydellisesti. Saatat joutua säätämään laskentataulukkoa manuaalisesti muunnoksen jälkeen.
Voinko muuntaa useita taulukoita sisältäviä PDF-tiedostoja?
Kyllä. Kaikki tekstisisältö kaikilta sivuilta poimitaan yhteen laskentataulukkoon. Eri sivujen taulukot näkyvät peräkkäisinä riveinä. Voit erotella ne tarpeen mukaan taulukkolaskentasovelluksessasi.
Entä skannatut PDF-taulukot?
Skannattuja PDF-tiedostoja, jotka sisältävät kuvia taulukoista, tämä työkalu ei pysty käsittelemään, koska poimittavaa tekstiä ei ole. Tarvitset tekstintunnistusohjelmiston (OCR) skannattujen kuvien muuntamiseen tekstiksi ensin.
Mitä taulukkolaskentamuotoa käytetään?
Tuloste on .xlsx-tiedosto (Office Open XML Spreadsheet -muoto), joka on yhteensopiva Microsoft Excelin, Google Sheetsin, LibreOffice Calcin, Apple Numbersin ja useimpien muiden taulukkolaskentasovellusten kanssa.

Liittyvät työkalut