OpenPDFTools

સ્કૅન કરેલ PDF માં ટેક્સ્ટ સિલેક્ટ થતો નથી - OCR થી આ કેવી રીતે ઠીક કરવું

Martin Pavličઅપડેટ કરવામાં આવ્યું 8 એપ્રિલ, 20266 મિનિટ વાંચો
શેર કરો
સ્કૅન કરેલ PDF માં ટેક્સ્ટ સિલેક્ટ થતો નથી - OCR થી આ કેવી રીતે ઠીક કરવું

સ્કૅન કરેલ PDF માં ટેક્સ્ટ સિલેક્ટ કેમ ન થઈ શકે?

જ્યારે કોઈ દસ્તાવેજ ભૌતિક રીતે સ્કૅન કરવામાં આવે છે અને PDF તરીકે સ્ટોર કરવામાં આવે છે, ત્યારે સ્કૅનર પૃષ્ઠની flat image કૅપ્ચર કરે છે - જેમ ફોટો ખેંચ્યો. પરિણામ ફાઇલમાં કોઈ વાસ્તવિક ટેક્સ્ટ characters નથી, ફક્ત pixels છે જે અક્ષરો જેવા દેખાય છે. તેથી જ દસ્તાવેજમાં ક્યાંય ક્લિક કરવાથી કંઈ સિલેક્ટ થતું નથી: આપના cursor માટે કોઈ text layer નથી.

આ સૌથી સામાન્ય PDF સમસ્યાઓ પૈકી એક છે. દસ્તાવેજ સ્ક્રીન પર સંપૂર્ણ વાંચી શકાય તેવો દેખાય છે, પરંતુ તે અનિવાર્યપણે PDF wrapper માં embedded photograph છે. આપ તેને શોધી શકતા નથી, તેમાંથી copy કરી શકતા નથી, અથવા screen reader ને તેને parse કરવા દઈ શકતા નથી.

OCR શું છે અને તે આ કેવી રીતે ઠીક કરે છે?

OCR (Optical Character Recognition) એ એક ટેક્નોલૉજી છે જે ટેક્સ્ટની image નું વિશ્લેષણ કરે છે અને તેને વાસ્તવિક, machine-readable characters માં રૂપાંતરિત કરે છે. સૉફ્ટવૅર અક્ષરોના આકાર જુએ છે, જાણીતા patterns સાથે સરખાવે છે, અને text layer output કરે છે જે PDF માં પાછી embed થઈ જાય છે.

OCR processing પછી, આપને searchable, selectable PDF મળે છે - દૃષ્ટિ રૂપે મૂળ જેવું જ, પરંતુ હવે આપનો cursor શબ્દો હાઇલાઇટ કરી શકે છે, Ctrl+F phrases શોધી શકે છે, અને copy-paste સામાન્ય રીતે કામ કરે છે. Screen readers અને accessibility tools પણ તે વાંચી શકે છે.

સ્કૅન કરેલ PDF પર OCR કેવી રીતે લાગુ કરવું

સ્કૅન કરેલ PDF માં OCR ઉમેરવાના ઘણા રસ્તા છે, free browser tools થી desktop software સુધી:

  • Word માં કન્વર્ટ કરો, પછી PDF તરીકે સ્ટોર કરો: અમારો PDF to Word converter visual content કાઢે છે અને editable Word document માં રૂપાંતરિત કરે છે. Word માં આવ્યા પછી ટેક્સ્ટ સંપૂર્ણ સિલેક્ટ થઈ શકે છે. પછી આપ proper text layer સાથે PDF માં re-export કરી શકો છો.
  • Adobe Acrobat (paid): Industry-standard tool. PDF ખોલો, Tools → Scan & OCR → Recognize Text પર જાઓ, અને Acrobat સીધી text layer ઉમેરે છે. ખર્ચાળ પણ અત્યંત ચોક્કસ.
  • Google Drive (free): આપનો સ્કૅન કરેલ PDF Google Drive પર અપલોડ કરો, right-click કરો, અને "Open with Google Docs" પસંદ કરો. Google આપોઆપ OCR ચલાવે છે અને Docs document માં ટેક્સ્ટ ખોલે છે. સ્વચ્છ scans માટે ઘણું સારું કામ કરે છે.
  • Tesseract OCR (free, open-source): ઘણી apps દ્વારા ઉપયોગ થતું powerful command-line OCR engine. Developers અથવા technical users માટે શ્રેષ્ઠ જે free self-hosted solution ઇચ્છે છે.
  • Adobe Acrobat online (limited free): Adobe subscription વગરના users માટે online tools દ્વારા સીમિત free OCR processing ઓફર કરે છે.

વધુ સારી OCR accuracy માટે ટિપ્સ

OCR ની ગુણવત્તા મૂળ scan ની ગુણવત્તા પર ઘણો આધાર રાખે છે. accuracy મહત્તમ કરવા માટે આ ટિપ્સ અનુસરો:

  • 300 DPI અથવા તેથી વધુ પર સ્કૅન કરો: ઓછા resolution ના scans ઝાંખા characters ઉત્પન્ન કરે છે જે OCR engines ખોટા વાંચે છે. 300 DPI ન્યૂનતમ છે; 600 DPI નાના ટેક્સ્ટ અથવા વિગતવાર દસ્તાવેજો માટે આદર્શ છે.
  • ટેક્સ્ટ દસ્તાવેજો માટે black-and-white ઉપયોગ કરો: Color scans plain text ની OCR accuracy સુધાર્યા વિના file size વધારે છે. મોટાભાગના દસ્તાવેજો માટે Black-and-white અથવા grayscale પૂરતું છે.
  • પૃષ્ઠ સીધા રાખો: Tilted અથવા skewed પૃષ્ઠ OCR software ને ગૂંચવે છે. મોટાભાગના આધુનિક tools auto-deskew કરી શકે છે, પરંતુ શરૂઆતથી સીધા રાખવાથી ફાયદો થાય છે.
  • Coffee stains અને smudges ટાળો: દસ્તાવેજ પર ભૌતિક ડાઘ characters તરીકે ખોટા વાંચવામાં આવે છે. શક્ય હોય ત્યાં original સ્વચ્છ કરો.
  • Output ચકાસો: OCR 100% ચોક્કસ નથી. હંમેશા પરિણામ proofread કરો, ખાસ કરીને numbers, punctuation અને handwritten ભાગો માટે.

OCR પછી: જ્યારે જરૂર હોય ત્યારે file size ઘટાડો

OCR processing ક્યારેક PDF file size વધારી શકે છે કારણ કે તે existing image layer ઉપર hidden text layer ઉમેરે છે. આપની પરિણામ ફાઇલ ઘણી મોટી હોય તો, visual quality ગુમાવ્યા વિના size ઘટાડવા માટે અમારો PDF compressor વાપરો.

OCR ટેક્સ્ટ યોગ્ય રીતે ઓળખ્યો ન કરે ત્યારે?

OCR accuracy મૂળ scan ની ગુણવત્તા પર આધાર રાખે છે. આ પ્રસંગોએ ખરાબ પરિણામ સામાન્ય છે: ઘણા નાના fonts (8pt ની નીચે), handwritten text, decorative અથવા અસામાન્ય fonts, ઝાંખી ink, અથવા 200 DPI ની નીચે low-quality scans. આ કિસ્સાઓમાં, manual retyping જરૂરી હોઈ શકે - અથવા OCR ફરીથી ચલાવ્યા પહેલા ઉચ્ચ ગુણવત્તા પર original document ફરીથી સ્કૅન કરો.

અવારનવાર પૂછાતા પ્રશ્નો

મારા PDF માં ટેક્સ્ટ સિલેક્ટ કેમ ન થઈ શકતો?
આપનો PDF scanned image છે, embedded text layer સાથે document નહીં. જ્યારે paper document સ્કૅન કરવામાં આવે છે અને PDF તરીકે સ્ટોર કરવામાં આવે છે, ત્યારે પરિણામ અનિવાર્યપણે પૃષ્ઠની photograph છે - અક્ષરોના આકારના pixels, પરંતુ વાસ્તવિક text નહીં. તેને સિલેક્ટ થઈ શકે તેવો બનાવવા માટે, text layer ઉમેરવા OCR (Optical Character Recognition) ચલાવવી જોઈએ.
શું સ્કૅન કરેલ PDF ટેક્સ્ટ સિલેક્ટ કરી શકાય તેવો બનાવવાનો કોઈ free રસ્તો છે?
હા - Google Drive free OCR આપે છે: PDF અપલોડ કરો, right-click કરો, અને Google Docs સાથે ખોલો. Google આપોઆપ ટેક્સ્ટ ઓળખે છે. વૈકલ્પિક રીતે, અમારો PDF to Word converter content editable document માં કાઢે છે. સંપૂર્ણ free desktop solution માટે, Tesseract OCR open-source અને ઘણું powerful છે.
OCR PDF ના દેખાવ બદલે છે?
ના - OCR existing image ની પાછળ invisible text layer ઉમેરે છે. PDF નો દૃશ્ય દેખાવ બિલકુલ એ જ રહે છે. ફક્ત text select, copy અને search કરવાની ક્ષમતા મળે છે. એકમાત્ર અપવાદ Word માં convert કરીને re-export કરવું છે, જ્યાં minor formatting ફેરફારો થઈ શકે છે.
સ્કૅન કરેલ દસ્તાવેજો પર OCR કેટલો ચોક્કસ છે?
આધુનિક OCR 300 DPI અથવા તેથી વધુ પર clean, well-scanned documents પર 95-99% ચોક્કસ છે. Low-resolution scans, handwriting, unusual fonts, અથવા ભૌતિક નુકસાન વાળા પૃષ્ઠો માટે accuracy નોંધપાત્ર રીતે ઘટે છે. મહત્ત્વના દસ્તાવેજો માટે ભરોસો રાખ્યા પહેલા હંમેશા output proofread કરો.
શું હું OCR વડે handwritten PDF ટેક્સ્ટ સિલેક્ટ કરી શકાય તેવો બનાવી શકું?
Standard OCR handwriting પર ખરાબ કામ કરે છે - તે printed, typed text માટે ડિઝાઇન કરવામાં આવ્યો છે. Specialized handwriting recognition tools છે પણ printed-text OCR કરતાં ઘણા ઓછા ચોક્કસ છે. document માં mixed print અને handwriting હોય તો, OCR printed ભાગ સાચો ઓળખશે પણ handwritten ભાગ ખોટા વાંચવાની સંભાવના છે.

સંબંધિત લેખ

PDF માં એમ્બેડેડ ફોન્ટ ખૂટે છે? 7 પગલામાં ખોટા ટેક્સ્ટ ડિસ્પ્લેને ઠીક કરો

જો તમારું પીડીએફ ટેક્સ્ટ અન્ય ઉપકરણ પર અલગ દેખાય છે, તો સામાન્ય રીતે એમ્બેડેડ ફોન્ટ્સ ખૂટે છે. નિદાન અને તેને ઝડપથી કેવી રીતે ઠીક કરવું તે અહીં છે. ✅

6 મિનિટ વાંચો

પીડીએફ કમ્પ્રેશન પછી ઝાંખી થઈ જાય છે? ગુણવત્તા જાળવવાની 7 રીતો (2026)

પીડીએફ સંકુચિત અને હવે ટેક્સ્ટ અથવા છબીઓ ઝાંખી દેખાય છે? શા માટે ગુણવત્તામાં ઘટાડો થાય છે અને વાંચનક્ષમતાને નષ્ટ કર્યા વિના ફાઇલનું કદ કેવી રીતે ઘટાડવું તે બરાબર જાણો. ✅

6 મિનિટ વાંચો

iPhone અથવા Android પર PDF ખોલી શકતા નથી? 6 ઇન્સ્ટન્ટ ફિક્સેસ (2026)

તમારા iPhone અથવા Android પર PDF ફાઇલ ખોલવા માટે સંઘર્ષ કરી રહ્યાં છો? તમે શા માટે ખાલી સ્ક્રીન જોઈ શકો છો અને ભારે એપ્લિકેશન્સ ઇન્સ્ટોલ કર્યા વિના તમારા દસ્તાવેજો કેવી રીતે જોશો તે જાણો. ✅

5 મિનિટ વાંચો