Tekst skeniranog PDF-a nije moguće označiti - kako to popraviti pomoću OCR-a

Zašto ne možete izabrati tekst u skeniranom PDF-u?
Kada se dokument fizički skenira i sačuva kao PDF, skener snima ravnu sliku stranice - slično kao fotografisanje. Nastala datoteka ne sadrži stvarne tekstualne znakove, samo piksele raspoređene da izgledaju kao slova. Zato klik bilo gde u dokumentu ništa ne bira: vaš kursor nema tekstni sloj koji bi mogao da uhvati.
Ovo je jedan od najčešćih problema sa PDF-om. Dokument na ekranu izgleda savršeno čitljivo, ali je u suštini fotografija umetnuta u PDF omotnicu. Ne možete ga pretraživati, kopirati iz njega niti dozvoliti čitaču ekrana da ga obradi.
Šta je OCR i kako to popravlja?
OCR (Optical Character Recognition) je tehnologija koja analizira sliku teksta i pretvara je u stvarne, mašinski čitljive znakove. Softver gleda oblike slova, upoređuje ih sa poznatim uzorcima i stvara tekstni sloj koji se ugrađuje nazad u PDF.
Nakon OCR obrade dobijate pretraživ, odabir PDF - vizuelno identičan originalu, ali sada vaš kursor može označavati reči, Ctrl+F može pronalaziti fraze, a kopiranje i lepljenje radi normalno. Čitači ekrana i alati za pristupačnost takođe ga mogu čitati.
Kako primeniti OCR na skeniran PDF
Postoji nekoliko načina dodavanja OCR-a skeniranom PDF-u, od besplatnih alata u pregledaču do desktop softvera:
- Konverzija u Word, zatim čuvanje kao PDF: Naš pretvarač PDF u Word ekstrahira vizuelni sadržaj i pretvara ga u uređivani Word dokument. Nakon otvaranja u Wordu, tekst je u potpunosti odabir. Zatim ga možete ponovo izvesti u PDF sa ispravnim tekstnim slojem.
- Adobe Acrobat (plaćeni): Industrijski standard. Otvorite PDF, idite na Alati → Skeniranje & OCR → Prepoznaj tekst i Acrobat direktno dodaje tekstni sloj. Skupo, ali veoma precizno.
- Google Drive (besplatno): Prenesite skenirani PDF na Google Drive, desnim klikom kliknite na njega i odaberite "Otvori sa Google Docs." Google automatski pokreće OCR i otvara tekst u Docs dokumentu. Iznenađujuće dobro funkcioniše za čiste skenove.
- Tesseract OCR (besplatno, open-source): Moćan OCR engine komandne linije koji koriste mnoge aplikacije. Najbolji za programere ili tehničke korisnike koji žele besplatno samohostovano rešenje.
- Adobe Acrobat online (ograničeno besplatno): Adobe nudi ograničenu besplatnu OCR obradu putem svojih online alata za korisnike bez pretplate.
Saveti za bolju tačnost OCR-a
Kvalitet OCR-a u velikoj meri zavisi od kvaliteta originalnog skena. Sledite ove savete za maksimalnu tačnost:
- Skenirajte pri 300 DPI ili više: Skenovi niže rezolucije proizvode zamagljene znakove koje OCR engine pogrešno čita. 300 DPI je minimum; 600 DPI je idealno za mali tekst ili detaljne dokumente.
- Koristite crno-belo za tekstualne dokumente: Skenovi u boji povećavaju veličinu datoteke bez poboljšanja tačnosti OCR-a za običan tekst. Crno-belo ili nijanse sive dovoljno je za većinu dokumenata.
- Držite stranice ravno: Nagnute ili iskrivljene stranice zbunjuju OCR softver. Većina modernih alata može automatski ispraviti, ali početak ravnog pomaže.
- Izbegavajte mrlje od kafe i tragove: Fizičke mrlje na dokumentu pogrešno se čitaju kao znakovi. Ako je moguće, očistite original.
- Proverite izlaz: OCR nije 100% tačan. Uvek pregledajte rezultat, posebno za brojeve, interpunkciju i rukom pisane delove.
Nakon OCR-a: smanjite veličinu datoteke ako je potrebno
OCR obrada ponekad može povećati veličinu PDF datoteke jer dodaje skriveni tekstni sloj na vrh postojećeg slikovnog sloja. Ako je rezultujuća datoteka prevelika, koristite naš PDF kompresor za smanjenje veličine bez gubitka vizuelnog kvaliteta.
Šta ako OCR ne prepoznaje tekst ispravno?
Tačnost OCR-a zavisi od kvaliteta originalnog skena. Loši rezultati su uobičajeni sa: veoma malim fontovima (ispod 8 pt), rukom pisanim tekstom, dekorativnim ili neobičnim fontovima, izbledjelom tintom ili skenovima niskog kvaliteta ispod 200 DPI. U tim slučajevima može biti potrebno ručno prepisivanje - ili ponovo skeniranje originalnog dokumenta u višem kvalitetu pre ponovnog pokretanja OCR-a.
Честа питања
Zašto tekst u mom PDF-u nije moguće označiti?▾
Postoji li besplatan način da se tekst skeniranog PDF-a može odabrati?▾
Da li OCR menja izgled PDF-a?▾
Koliko je OCR precizan na skeniranim dokumentima?▾
Mogu li OCR-om učiniti tekst rukom pisanog PDF-a odabranim?▾
Повезани чланци
Недостају уграђени фонтови у ПДФ-у? Поправите погрешан приказ текста у 7 корака
Ако ваш ПДФ текст изгледа другачије на другом уређају, разлог је обично недостатак уграђених фонтова. Ево како то брзо дијагностиковати и поправити. ✅
6 мин читањаПДФ постаје мутан након компресије? 7 начина да очувате квалитет (2026)
Компресовали сте ПДФ и сада текст или слике изгледају мутно? Сазнајте зашто тачно опада квалитет и како да смањите величину датотеке без уништавања читљивости. ✅
6 мин читањаНе можете да отворите ПДФ на иПхоне-у или Андроид-у? 6 тренутних поправки (2026)
Мучите се да отворите ПДФ датотеку на свом иПхоне-у или Андроид-у? Сазнајте зашто можете да видите празан екран и како да прегледате своје документе без инсталирања тешких апликација. ✅
5 мин читања