스캔한 PDF 텍스트가 선택되지 않는 경우 - OCR로 수정하는 방법

스캔한 PDF에서 텍스트를 선택할 수 없는 이유는 무엇인가요?
문서가 물리적으로 스캔되어 PDF로 저장되면, 스캐너는 마치 사진을 찍는 것처럼 페이지의 평면 이미지를 캡처합니다. 생성된 파일에는 실제 텍스트 문자가 포함되지 않으며, 글자처럼 보이도록 배열된 픽셀만 있습니다. 그래서 문서의 어디를 클릭해도 아무것도 선택되지 않습니다. 커서가 잡을 텍스트 레이어가 없기 때문입니다.
이것은 PDF와 관련된 가장 일반적인 불만 중 하나입니다. 문서는 화면에서 완벽하게 읽을 수 있는 것처럼 보이지만, 본질적으로 PDF 래퍼에 삽입된 사진입니다. 검색하거나, 복사하거나, 스크린 리더로 파싱할 수 없습니다.
OCR이란 무엇이며 어떻게 이 문제를 해결하나요?
OCR(광학 문자 인식)은 텍스트 이미지를 분석하여 실제 기계 판독 가능한 문자로 변환하는 기술입니다. 소프트웨어는 글자의 모양을 살펴보고, 알려진 패턴과 비교하며, PDF에 다시 삽입되는 텍스트 레이어를 출력합니다.
OCR 처리 후에는 검색 및 선택 가능한 PDF를 얻을 수 있습니다. 시각적으로는 원본과 동일하지만, 이제 커서로 단어를 강조 표시하고, Ctrl+F로 구문을 찾고, 복사 붙여넣기가 정상적으로 작동합니다. 스크린 리더와 접근성 도구도 이를 읽을 수 있습니다.
스캔한 PDF에 OCR 적용하는 방법
스캔한 PDF에 OCR을 추가하는 방법에는 무료 브라우저 도구부터 데스크탑 소프트웨어까지 여러 가지가 있습니다:
- Word로 변환 후 PDF로 저장: 저희 PDF to Word 변환기는 시각적 콘텐츠를 추출하여 편집 가능한 Word 문서로 변환합니다. Word에서 텍스트는 완전히 선택 가능합니다. 그런 다음 적절한 텍스트 레이어가 있는 PDF로 다시 내보낼 수 있습니다.
- Adobe Acrobat(유료): 업계 표준 도구입니다. PDF를 열고, 도구 → 스캔 & OCR → 텍스트 인식으로 이동하면 Acrobat이 텍스트 레이어를 직접 추가합니다. 비싸지만 정확도가 높습니다.
- Google Drive(무료): 스캔한 PDF를 Google Drive에 업로드하고, 마우스 오른쪽 버튼을 클릭하여 "Google 문서로 열기"를 선택합니다. Google이 자동으로 OCR을 실행하고 텍스트를 Docs 문서로 엽니다. 깨끗한 스캔에는 놀랍도록 잘 작동합니다.
- Tesseract OCR(무료, 오픈소스): 많은 앱에서 사용하는 강력한 명령줄 OCR 엔진입니다. 무료 셀프 호스팅 솔루션을 원하는 개발자나 기술 사용자에게 최적입니다.
- Adobe Acrobat 온라인(제한적 무료): Adobe는 구독 없는 사용자를 위해 온라인 도구를 통해 제한적인 무료 OCR 처리를 제공합니다.
더 나은 OCR 정확도를 위한 팁
OCR 품질은 원본 스캔의 품질에 크게 의존합니다. 정확도를 극대화하려면 다음 팁을 따르세요:
- 300 DPI 이상으로 스캔: 저해상도 스캔은 OCR 엔진이 잘못 읽는 흐릿한 문자를 생성합니다. 300 DPI가 최소이며, 작은 텍스트나 상세한 문서에는 600 DPI가 이상적입니다.
- 텍스트 문서에는 흑백 사용: 컬러 스캔은 일반 텍스트의 OCR 정확도를 개선하지 않고 파일 크기만 늘립니다. 대부분의 문서에는 흑백 또는 그레이스케일로 충분합니다.
- 페이지를 똑바로 유지: 기울어진 페이지는 OCR 소프트웨어를 혼란시킵니다. 최신 도구는 대부분 자동 기울기 보정이 가능하지만, 처음부터 똑바로 스캔하는 것이 도움이 됩니다.
- 커피 얼룩과 지저분한 자국 방지: 문서의 물리적 흔적은 문자로 잘못 읽힙니다. 가능하면 원본을 깨끗이 하세요.
- 출력 확인: OCR은 100% 정확하지 않습니다. 특히 숫자, 구두점, 손으로 쓴 부분에 대해 항상 결과를 교정하세요.
OCR 후: 필요한 경우 파일 크기 줄이기
OCR 처리는 기존 이미지 레이어 위에 숨겨진 텍스트 레이어를 추가하기 때문에 PDF 파일 크기가 증가할 수 있습니다. 결과 파일이 너무 크다면, 저희 PDF 압축기를 사용하여 시각적 품질을 잃지 않고 크기를 줄이세요.
OCR이 텍스트를 올바르게 인식하지 못하는 경우는?
OCR 정확도는 원본 스캔 품질에 달려 있습니다. 결과가 좋지 않은 경우는: 매우 작은 폰트(8pt 이하), 손으로 쓴 텍스트, 장식적이거나 특이한 폰트, 색이 바랜 잉크, 또는 200 DPI 이하의 저품질 스캔입니다. 이런 경우에는 수동으로 다시 입력하거나, OCR을 다시 실행하기 전에 원본 문서를 더 높은 품질로 재스캔해야 할 수 있습니다.
자주 묻는 질문
PDF에서 텍스트가 선택되지 않는 이유는 무엇인가요?▾
스캔한 PDF 텍스트를 무료로 선택 가능하게 만드는 방법이 있나요?▾
OCR은 PDF의 외관을 변경하나요?▾
스캔 문서에서 OCR의 정확도는 어느 정도인가요?▾
OCR로 손으로 쓴 PDF 텍스트를 선택 가능하게 만들 수 있나요?▾
관련 기사
PDF에 포함된 글꼴이 없습니까? 7단계로 잘못된 텍스트 표시 수정
PDF 텍스트가 다른 장치에서 다르게 보이는 경우 일반적으로 포함된 글꼴이 없기 때문입니다. 빠르게 진단하고 해결하는 방법은 다음과 같습니다. ✅
6분 읽기압축 후 PDF가 흐려지나요? 품질을 유지하는 7가지 방법(2026년)
PDF를 압축하면 텍스트나 이미지가 흐릿하게 보입니까? 품질이 떨어지는 이유와 가독성을 훼손하지 않고 파일 크기를 줄이는 방법을 정확히 알아보세요. ✅
6분 읽기iPhone이나 Android에서 PDF를 열 수 없나요? 6가지 즉각적인 수정(2026년)
iPhone이나 Android에서 PDF 파일을 여는 데 어려움을 겪고 계십니까? 빈 화면이 나타나는 이유와 무거운 앱을 설치하지 않고 문서를 보는 방법을 알아보세요. ✅
5분 읽기