Tekst skeniranog PDF-a nije moguće označiti - kako to popraviti pomoću OCR-a

Zašto ne možete odabrati tekst u skeniranom PDF-u?
Kada se dokument fizički skenira i sačuva kao PDF, skener snima ravnu sliku stranice - slično kao fotografisanje. Nastala datoteka ne sadrži stvarne tekstualne znakove, samo piksele raspoređene da izgledaju kao slova. Zato klik bilo gdje u dokumentu ništa ne odabire: vaš kursor nema tekstni sloj koji bi mogao uhvatiti.
Ovo je jedan od najčešćih problema sa PDF-om. Dokument na ekranu izgleda savršeno čitljivo, ali je u biti fotografija umetnuta u PDF omotnicu. Ne možete ga pretraživati, kopirati iz njega niti dozvoliti čitaču ekrana da ga obradi.
Šta je OCR i kako to popravlja?
OCR (Optical Character Recognition) je tehnologija koja analizira sliku teksta i pretvara je u stvarne, mašinski čitljive znakove. Softver gleda oblike slova, upoređuje ih sa poznatim uzorcima i stvara tekstni sloj koji se ugrađuje nazad u PDF.
Nakon OCR obrade dobijate pretraga, odabir PDF - vizuelno identičan originalu, ali sada vaš kursor može označavati riječi, Ctrl+F može pronalaziti fraze, a kopiranje i lijepljenje radi normalno. Čitači ekrana i alati za pristupačnost također ga mogu čitati.
Kako primijeniti OCR na skenirani PDF
Postoji nekoliko načina dodavanja OCR-a skeniranom PDF-u, od besplatnih alata u pregledaču do desktop softvera:
- Konverzija u Word, zatim čuvanje kao PDF: Naš pretvarač PDF u Word ekstrahira vizualni sadržaj i pretvara ga u uređivani Word dokument. Nakon otvaranja u Wordu, tekst je u potpunosti odabir. Zatim ga možete ponovo izvesti u PDF sa ispravnim tekstnim slojem.
- Adobe Acrobat (plaćeni): Industrijski standard. Otvorite PDF, idite na Alati → Skeniranje & OCR → Prepoznaj tekst i Acrobat direktno dodaje tekstni sloj. Skupo, ali veoma precizno.
- Google Drive (besplatno): Prenesite skenirani PDF na Google Drive, desnim klikom kliknite na njega i odaberite "Otvori sa Google Docs." Google automatski pokreće OCR i otvara tekst u Docs dokumentu. Iznenađujuće dobro funkcioniše za čiste skenove.
- Tesseract OCR (besplatno, open-source): Moćan OCR engine komandne linije koji koriste mnoge aplikacije. Najbolji za programere ili tehničke korisnike koji žele besplatno samohostovano rješenje.
- Adobe Acrobat online (ograničeno besplatno): Adobe nudi ograničenu besplatnu OCR obradu putem svojih online alata za korisnike bez pretplate.
Savjeti za bolju tačnost OCR-a
Kvalitet OCR-a u velikoj mjeri zavisi od kvaliteta originalnog skena. Slijedite ove savjete za maksimalnu tačnost:
- Skenirajte pri 300 DPI ili više: Skenovi niže rezolucije proizvode zamagljene znakove koje OCR engine pogrešno čita. 300 DPI je minimum; 600 DPI je idealno za mali tekst ili detaljne dokumente.
- Koristite crno-bijelo za tekstualne dokumente: Skenovi u boji povećavaju veličinu datoteke bez poboljšanja tačnosti OCR-a za obični tekst. Crno-bijelo ili nijanse sive dovoljno je za većinu dokumenata.
- Držite stranice ravno: Nagnute ili iskrivljene stranice zbunjuju OCR softver. Većina modernih alata može automatski ispraviti, ali početak ravnog pomaže.
- Izbjegavajte mrlje od kafe i tragove: Fizičke mrlje na dokumentu pogrešno se čitaju kao znakovi. Ako je moguće, očistite original.
- Provjerite izlaz: OCR nije 100% tačan. Uvijek pregledajte rezultat, posebno za brojeve, interpunkciju i rukom pisane dijelove.
Nakon OCR-a: smanjite veličinu datoteke ako je potrebno
OCR obrada ponekad može povećati veličinu PDF datoteke jer dodaje skriveni tekstni sloj na vrh postojećeg slikovnog sloja. Ako je rezultujuća datoteka prevelika, koristite naš PDF kompresor za smanjenje veličine bez gubitka vizuelnog kvaliteta.
Šta ako OCR ne prepoznaje tekst ispravno?
Tačnost OCR-a zavisi od kvaliteta originalnog skena. Loši rezultati su uobičajeni sa: veoma malim fontovima (ispod 8 pt), rukom pisanim tekstom, dekorativnim ili neobičnim fontovima, izblijedjelom tintom ili skenovima niskog kvaliteta ispod 200 DPI. U tim slučajevima može biti potrebno ručno prepisivanje - ili ponovo skeniranje originalnog dokumenta u višem kvalitetu prije ponovnog pokretanja OCR-a.
Često postavljana pitanja
Zašto tekst u mom PDF-u nije moguće označiti?▾
Postoji li besplatan način da se tekst skeniranog PDF-a može odabrati?▾
Da li OCR mijenja izgled PDF-a?▾
Koliko je OCR precizan na skeniranim dokumentima?▾
Mogu li OCR-om učiniti tekst rukom pisanog PDF-a odabranim?▾
Povezani članci
Nedostaju ugrađeni fontovi u PDF-u? Popravite pogrešan prikaz teksta u 7 koraka
Ako vaš PDF tekst izgleda drugačije na drugom uređaju, razlog je obično nedostatak ugrađenih fontova. Evo kako to brzo dijagnosticirati i popraviti. ✅
6 min čitanjaPDF postaje mutan nakon kompresije? 7 načina da zadržite kvalitet (2026)
Komprimirali ste PDF i sada tekst ili slike izgledaju mutno? Saznajte zašto tačno opada kvaliteta i kako smanjiti veličinu datoteke bez uništavanja čitljivosti. ✅
6 min čitanjaNe možete otvoriti PDF na iPhoneu ili Androidu? 6 trenutnih popravki (2026)
Mučite se da otvorite PDF datoteku na svom iPhoneu ili Androidu? Saznajte zašto možete vidjeti prazan ekran i kako pregledati svoje dokumente bez instaliranja teških aplikacija. ✅
5 min čitanja