Tekst skeniranog PDF-a nije moguće označiti - kako to popraviti pomoću OCR-a

Zašto ne možete odabrati tekst u skeniranom PDF-u?
Kada se dokument fizički skenira i spremi kao PDF, skener snima ravnu sliku stranice - slično kao fotografiranje. Nastala datoteka ne sadrži stvarne tekstualne znakove, samo piksele raspoređene da izgledaju kao slova. Zato klik bilo gdje u dokumentu ništa ne odabire: vaš kursor nema tekstni sloj koji bi mogao uhvatiti.
Ovo je jedan od najčešćih problema s PDF-om. Dokument na ekranu izgleda savršeno čitljivo, ali je u biti fotografija umetnuta u PDF omotnicu. Ne možete ga pretraživati, kopirati iz njega niti dopustiti čitaču ekrana da ga obradi.
Što je OCR i kako to popravlja?
OCR (Optical Character Recognition) je tehnologija koja analizira sliku teksta i pretvara je u stvarne, strojno čitljive znakove. Softver gleda oblike slova, uspoređuje ih s poznatim uzorcima i stvara tekstni sloj koji se ugrađuje natrag u PDF.
Nakon OCR obrade dobivate pretraživ, odabireći PDF - vizualno identičan originalu, ali sada vaš kursor može označavati riječi, Ctrl+F može pronalaziti fraze, a kopiranje i lijepljenje radi normalno. Čitači ekrana i alati za pristupačnost također ga mogu čitati.
Kako primijeniti OCR na skenirani PDF
Postoji nekoliko načina dodavanja OCR-a skeniranom PDF-u, od besplatnih alata u pregledniku do desktop softvera:
- Pretvorba u Word, zatim spremanje kao PDF: Naš pretvarač PDF u Word ekstrahira vizualni sadržaj i pretvara ga u uređivani Word dokument. Nakon otvaranja u Wordu, tekst je u potpunosti odabir. Zatim ga možete ponovo izvesti u PDF s ispravnim tekstnim slojem.
- Adobe Acrobat (plaćeni): Industrijski standard. Otvorite PDF, idite na Alati → Skeniranje & OCR → Prepoznaj tekst i Acrobat izravno dodaje tekstni sloj. Skupo, ali vrlo precizno.
- Google Drive (besplatno): Prenesite skenirani PDF na Google Drive, desnom tipkom kliknite na njega i odaberite "Otvori s Google Docs." Google automatski pokreće OCR i otvara tekst u Docs dokumentu. Iznenađujuće dobro funkcionira za čiste skenove.
- Tesseract OCR (besplatno, open-source): Moćan OCR engine naredbenog retka koji koriste mnoge aplikacije. Najbolji za programere ili tehničke korisnike koji žele besplatno samohostovano rješenje.
- Adobe Acrobat online (ograničeno besplatno): Adobe nudi ograničenu besplatnu OCR obradu putem svojih online alata za korisnike bez pretplate.
Savjeti za bolju točnost OCR-a
Kvaliteta OCR-a uvelike ovisi o kvaliteti originalnog skena. Slijedite ove savjete za maksimalnu točnost:
- Skenirajte pri 300 DPI ili više: Skenovi niže rezolucije proizvode zamagljene znakove koje OCR engine pogrešno čita. 300 DPI je minimum; 600 DPI je idealno za mali tekst ili detaljne dokumente.
- Koristite crno-bijelo za tekstualne dokumente: Skenovi u boji povećavaju veličinu datoteke bez poboljšanja točnosti OCR-a za običan tekst. Crno-bijelo ili nijanse sive dovoljno je za većinu dokumenata.
- Držite stranice ravno: Nagnute ili iskrivljene stranice zbunjuju OCR softver. Većina modernih alata može automatski ispraviti, ali početak ravnog pomaže.
- Izbjegavajte mrlje od kave i tragove: Fizičke mrlje na dokumentu pogrešno se čitaju kao znakovi. Ako je moguće, očistite original.
- Provjerite izlaz: OCR nije 100% točan. Uvijek pregledajte rezultat, posebno za brojeve, interpunkciju i rukom pisane dijelove.
Nakon OCR-a: smanjite veličinu datoteke ako je potrebno
OCR obrada ponekad može povećati veličinu PDF datoteke jer dodaje skriveni tekstni sloj na vrh postojećeg slikovnog sloja. Ako je rezultirajuća datoteka prevelika, koristite naš PDF kompresor za smanjenje veličine bez gubitka vizualne kvalitete.
Što ako OCR ne prepoznaje tekst ispravno?
Točnost OCR-a ovisi o kvaliteti originalnog skena. Loši rezultati su uobičajeni s: vrlo malim fontovima (ispod 8 pt), rukom pisanim tekstom, dekorativnim ili neobičnim fontovima, izblijedjelim tintom ili skenovima niske kvalitete ispod 200 DPI. U tim slučajevima može biti potrebno ručno prepisivanje - ili ponovo skeniranje originalnog dokumenta u višoj kvaliteti prije ponovnog pokretanja OCR-a.
Često postavljana pitanja
Zašto tekst u mom PDF-u nije moguće označiti?▾
Postoji li besplatan način da se tekst skeniranog PDF-a može odabrati?▾
Mijenja li OCR izgled PDF-a?▾
Koliko je OCR precizan na skeniranim dokumentima?▾
Mogu li OCR-om učiniti tekst rukom pisanog PDF-a odabranim?▾
Povezani članci
Nedostaju ugrađeni fontovi u PDF-u? Popravite pogrešan prikaz teksta u 7 koraka
Ako vaš PDF tekst izgleda drugačije na drugom uređaju, razlog su obično nedostajući ugrađeni fontovi. Evo kako to brzo dijagnosticirati i popraviti. ✅
6 min čitanjaPDF postaje mutan nakon kompresije? 7 načina da zadržite kvalitetu (2026.)
Komprimirali ste PDF i sada tekst ili slike izgledaju mutno? Saznajte točno zašto kvaliteta opada i kako smanjiti veličinu datoteke bez uništavanja čitljivosti. ✅
6 min čitanjaNe možete otvoriti PDF na iPhoneu ili Androidu? 6 trenutnih popravka (2026)
Mučite se s otvaranjem PDF datoteke na svom iPhoneu ili Androidu? Saznajte zašto biste mogli vidjeti prazan ekran i kako pregledati svoje dokumente bez instaliranja teških aplikacija. ✅
5 min čitanja