ස්කෑන් කළ PDF හි ඇති පෙළ තෝරාගත නොහැක - OCR සමඟ මෙය නිවැරදි කරන්නේ කෙසේද

ස්කෑන් කළ PDF හි ඇති පෙළ තෝරාගත නොහැක්කේ ඇයි?
ලේඛනයක් භෞතිකව ස්කෑන් කර PDF ලෙස සුරකින විට, ස්කෑනරය පිටුවේ flat image එකක් ග්රහණය කරයි - ඡායාරූපයක් ගත් ආකාරයට. ලැබෙන ගොනුවේ සැබෑ පෙළ characters නොමැත, ඇත්තේ අකුරු ආකාරයෙන් පෙනෙන pixels පමණි. ඒ නිසයි ලේඛනයේ ඕනෑම තැනක ක්ලික් කළ විට කිසිවක් තෝරාගත නොහැකි වන්නේ: ඔබගේ cursor සඳහා text layer නොමැත.
මෙය PDF හා සම්බන්ධ වඩාත් සාමාන්ය ගැටලු වලින් එකකි. ලේඛනය තිරය මත කියවිය හැකි ලෙස දිස් වේ, නමුත් එය PDF wrapper එකක ඇතුළත් ඡායාරූප රූපයකි. ඔබට එය සෙවිය නොහැක, එයින් copy කළ නොහැක, හෝ screen reader ට එය parse කිරීමට ඉඩ දිය නොහැක.
OCR යනු කුමක්ද සහ එය මෙය නිවැරදි කරන්නේ කෙසේද?
OCR (Optical Character Recognition) යනු පෙළෙහි රූපය විශ්ලේෂණය කර එය සැබෑ, machine-readable characters බවට පරිවර්තනය කරන තාක්ෂණයකි. මෘදුකාංගය අකුරු ආකෘතීන් දෙස බලා, ඒවා දන්නා patterns සමඟ සංසන්දනය කර, PDF හි නැවත embed කෙරෙන text layer එකක් output කරයි.
OCR processing පසු, ඔබට searchable, selectable PDF එකක් ලැබේ - දෘශ්යාත්මකව මුලිනිකට සමාන, නමුත් දැන් ඔබගේ cursor වචන highlight කළ හැක, Ctrl+F ට phrases සෙවිය හැක, copy-paste සාමාන්ය ලෙස ක්රියා කරයි. Screen readers සහ accessibility tools ද එය කියවිය හැක.
ස්කෑන් කළ PDF හි OCR යෙදිය යුත්තේ කෙසේද
ස්කෑන් කළ PDF හි OCR එකතු කිරීමට free browser tools සිට desktop software දක්වා ක්රම කිහිපයක් ඇත:
- Word වෙත පරිවර්තනය කර, PDF ලෙස සුරකින්න: අපගේ PDF to Word converter visual content ලබා ගෙන editable Word document බවට පරිවර්තනය කරයි. Word හිදී පෙළ සම්පූර්ණයෙන් තෝරාගත හැකිය. ඉන්පසු proper text layer සමඟ PDF ලෙස re-export කළ හැක.
- Adobe Acrobat (paid): Industry-standard tool. PDF විවෘත කර, Tools → Scan & OCR → Recognize Text වෙත යන්න, Acrobat සෘජුවම text layer එකතු කරයි. මිල අධික නමුත් ඉතා නිවැරදිය.
- Google Drive (free): ස්කෑන් කළ PDF ඔබගේ Google Drive වෙත upload කර, right-click කර, "Open with Google Docs" තෝරන්න. Google ස්වයංක්රීයව OCR ධාවනය කර Docs document හි පෙළ විවෘත කරයි. පිරිසිදු scans සඳහා ඉතා හොඳින් ක්රියා කරයි.
- Tesseract OCR (free, open-source): බොහෝ apps භාවිතා කරන ශක්තිමත් command-line OCR engine. free self-hosted solution කැමති developers හෝ technical users සඳහා ශ්රේෂ්ඨය.
- Adobe Acrobat online (limited free): Adobe subscription නොමැති users සඳහා online tools හරහා සීමිත free OCR processing ලබා දේ.
වඩා හොඳ OCR accuracy සඳහා උපදෙස්
OCR ගුණාත්මකභාවය මුල් scan ගුණාත්මකභාවය මත බෙහෙවින් රඳා පවතී. accuracy උපරිම කිරීමට මෙම උපදෙස් අනුගමනය කරන්න:
- 300 DPI හෝ ඊට වැඩි ප්රමාණයකින් ස්කෑන් කරන්න: අඩු resolution ස්කෑන් OCR engines ව්යාකූල ලෙස කියවන අවිනිශ්චිත characters නිපදවයි. 300 DPI අවම සීමාවයි; 600 DPI කුඩා පෙළ හෝ සවිස්තරාත්මක ලේඛන සඳහා ශ්රේෂ්ඨ වේ.
- පෙළ ලේඛන සඳහා black-and-white භාවිතා කරන්න: Color scans plain text සඳහා OCR accuracy වැඩිදියුණු නොකර file size වැඩි කරයි. බොහෝ ලේඛන සඳහා Black-and-white හෝ grayscale ප්රමාණවත්ය.
- පිටු සෘජු ලෙස තබාගන්න: Tilted හෝ skewed පිටු OCR software ව්යාකූල කරයි. නවීන tools බොහොමයක් auto-deskew කළ හැකිය, නමුත් ආරම්භයේ සිට සෘජු ලෙස තිබීම සහාය වේ.
- Coffee stains සහ smudges වළකින්න: ලේඛනයේ භෞතික සලකුණු characters ලෙස ව්යාකූල ලෙස කියවේ. හැකි නම් original පිරිසිදු කරන්න.
- Output පරීක්ෂා කරන්න: OCR 100% නිවැරදි නොවේ. සෑම විටම ප්රතිඵලය proofread කරන්න, විශේෂයෙන් numbers, punctuation සහ handwritten කොටස් සඳහා.
OCR පසු: අවශ්ය නම් file size අඩු කරන්න
OCR processing සමහර විට PDF file size වැඩි කළ හැකිය, මන්ද එය පවතින image layer ඉහළ hidden text layer එකතු කරන නිසාය. ලැබෙන ගොනුව ඉතා විශාල නම්, visual quality නොකඩා size අඩු කිරීමට අපගේ PDF compressor භාවිතා කරන්න.
OCR නිවැරදිව පෙළ හඳුනා නොගත්තොත් කුමක් කළ යුතුද?
OCR accuracy මුල් scan ගුණාත්මකභාවය මත රඳා පවතී. මෙම අවස්ථාවලදී දුර්වල ප්රතිඵල සාමාන්ය: ඉතා කුඩා fonts (8pt ට අඩු), handwritten පෙළ, decorative හෝ අසාමාන්ය fonts, ක්ලාන්ත ink, හෝ 200 DPI ට අඩු low-quality scans. මෙම අවස්ථාවලදී, manual retyping අවශ්ය විය හැකිය - නැතිනම් OCR නැවත ධාවනය කිරීමට පෙර ඉහළ ගුණාත්මකභාවයෙන් original ලේඛනය නැවත ස්කෑන් කරන්න.
නිතර අසන ප්රශ්න
මගේ PDF හි ඇති පෙළ තෝරාගත නොහැක්කේ ඇයි?▾
ස්කෑන් කළ PDF පෙළ තෝරාගත හැකි කිරීමට නොමිලේ ක්රමයක් තිබේද?▾
OCR PDF දිස්වන ආකාරය වෙනස් කරයිද?▾
ස්කෑන් කළ ලේඛනවල OCR කෙතරම් නිවැරදිද?▾
OCR සමඟ handwritten PDF පෙළ තෝරාගත හැකි කළ හැකිද?▾
සම්බන්ධිත ලිපි
PDF හි Embedded Fonts අස්ථානගතද? වැරදි පෙළ සංදර්ශකය පියවර 7කින් නිවැරදි කරන්න
ඔබගේ PDF පෙළ වෙනත් උපාංගයක වෙනස් ලෙස පෙනේ නම්, කාවැද්දූ අකුරු නොමැති වීම සාමාන්යයෙන් හේතුව වේ. එය ඉක්මනින් හඳුනාගෙන නිවැරදි කරන්නේ කෙසේද යන්න මෙන්න. ✅
විනාඩි 6 ක කියවීමක්සම්පීඩනය කිරීමෙන් පසු PDF බොඳ වේ ද? ගුණාත්මකව තබා ගැනීමට මාර්ග 7 (2026)
PDF එකක් සම්පීඩිත කර ඇති අතර දැන් පෙළ හෝ පින්තූර බොඳ වී තිබේද? ගුණාත්මකභාවය පහත වැටෙන්නේ ඇයි සහ කියවීමේ හැකියාව විනාශ නොකර ගොනු ප්රමාණය අඩු කරන්නේ කෙසේදැයි හරියටම ඉගෙන ගන්න. ✅
විනාඩි 6 ක කියවීමක්iPhone හෝ Android මත PDF විවෘත කළ නොහැකිද? 6 ක්ෂණික නිවැරදි කිරීම් (2026)
ඔබගේ iPhone හෝ Android මත PDF ගොනුවක් විවෘත කිරීමට අරගල කරනවාද? ඔබට හිස් තිරයක් දැකිය හැක්කේ මන්දැයි සහ බර යෙදුම් ස්ථාපනය නොකර ඔබේ ලේඛන බලන්නේ කෙසේදැයි ඉගෙන ගන්න. ✅
විනාඩි 5 ක කියවීමක්