OpenPDFTools

PDF를 온라인에서 무료로 Excel로 변환하세요

PDF 파일에서 텍스트 및 표 형식 데이터를 추출하여 Excel 스프레드시트(.xlsx)로 변환합니다. 이 도구는 텍스트 레이아웃을 분석하여 행과 열을 감지하므로 스프레드시트에서 PDF 데이터로 쉽게 작업할 수 있습니다. ✓

여기에 파일을 놓거나 클릭하여 찾아보세요.

파일당 최대 200MB - 로컬에서 처리됨

How It Works

1

Upload your PDF file

2

테이블이 자동으로 감지되고 추출됩니다.

3

Excel 스프레드시트(.xlsx) 다운로드

PDF를 Excel로 변환하는 방법은 무엇입니까?

PDF를 Excel로 변환하면 문서에서 텍스트를 추출하고 공간 레이아웃을 분석하여 행과 열을 감지하고 구조화된 .xlsx 스프레드시트를 만듭니다. 이 도구는 텍스트 요소가 각 페이지에 배치되는 방식을 검사하여 표 형식 데이터를 식별합니다. 동일한 수평선에 있는 요소는 행이 되며, 그룹 간의 일관된 간격으로 열 경계가 정의됩니다.

추출 파이프라인은 전적으로 브라우저에서 실행됩니다. PDF.js는 문서를 읽고 x/y 좌표가 있는 텍스트 항목을 반환합니다. 레이아웃 분석 코드는 이러한 항목을 위치에 따라 행과 열로 그룹화합니다. 그런 다음 xlsx 라이브러리는 감지된 구조로 스프레드시트를 생성합니다. 열 간격이 명확하고 형식이 잘 지정된 테이블의 경우 감지 정확도는 일반적으로 90% 이상입니다. 셀이 병합되었거나 간격이 불규칙한 복잡한 테이블은 수동 조정이 필요할 수 있습니다.

사람들이 정기적으로 PDF에서 스프레드시트로 추출하는 데이터:

  • 수익표가 포함된 재무제표 및 분기별 보고서
  • 제품 이름, 수량 및 가격이 포함된 송장 개별 항목
  • 대학 포털의 학업 성적표 및 학생 기록
  • 사양이 열로 정리된 제품 카탈로그
  • 인구 통계 또는 경제 데이터 테이블이 포함된 정부 통계 보고서

클라우드 추출 서비스는 보다 정교한 알고리즘(때때로 AI 포함)을 사용하며 더 복잡한 테이블 레이아웃을 처리할 수 있습니다. 귀하가 통제할 수 없는 서버에 재무제표나 고객 데이터를 업로드하는 데 드는 비용입니다. 열 간격이 규칙적인 간단한 테이블의 경우 브라우저 기반 추출이 클라우드 품질과 일치합니다. 중첩된 테이블이 있는 복잡한 보고서의 경우 스프레드시트 출력을 수동으로 조정해야 할 수도 있습니다.

PDF에 표가 아닌 텍스트가 대부분 포함되어 있는 경우PDF를 워드로더 잘 맞습니다. 데이터를 Excel로 추출한 후 다음을 수행할 수 있습니다.원본 PDF 분할관련 페이지만 유지하거나압축하다보관하기 전에.

왜 OpenPDFTools인가?

100% 비공개

귀하의 파일은 절대로 장치를 떠나지 않습니다. 모든 처리는 WebAssembly 기술을 사용하여 브라우저에서 로컬로 이루어집니다. 데이터 수집이 없고 개인 정보 보호 위험이 없습니다.

Completely Free

등록이 필요하지 않습니다. 숨겨진 수수료가 없습니다. 파일 제한이 없습니다. 워터마크가 없습니다. 필요할 때마다 필요한 도구만 있으면 됩니다.

Lightning Fast

업로드/다운로드 대기 시간이 없습니다. 파일은 장치에서 즉시 처리됩니다. 대용량 파일도 몇 초 안에 처리됩니다.

Frequently Asked Questions

테이블 감지는 어떻게 작동하나요?
이 도구는 PDF에서 텍스트를 추출하고 각 텍스트 요소의 공간 위치를 분석합니다. 동일한 가로선에 있는 요소는 행이 되며, 요소 사이의 간격에 따라 열 경계가 정의됩니다. 이는 명확한 형식의 테이블에 적합합니다.
복잡한 테이블이 정확하게 변환됩니까?
도구는 간단하고 구조가 잘 구성된 테이블에서 가장 잘 작동합니다. 병합된 셀, 중첩된 표 또는 불규칙한 레이아웃이 있는 복잡한 표는 완벽하게 변환되지 않을 수 있습니다. 변환 후 스프레드시트를 수동으로 조정해야 할 수도 있습니다.
여러 테이블이 포함된 PDF를 변환할 수 있나요?
예. 모든 페이지의 모든 텍스트 콘텐츠가 단일 스프레드시트로 추출됩니다. 다른 페이지의 테이블은 연속된 행으로 표시됩니다. 그런 다음 스프레드시트 애플리케이션에서 필요에 따라 분리할 수 있습니다.
스캔한 PDF 테이블은 어떻습니까?
테이블 의 이미지가 포함된 스캔한 PDF는 추출 가능한 텍스트가 없기 때문에 이 도구로 처리할 수 없습니다. 먼저 스캔한 이미지를 텍스트로 변환하려면 OCR 소프트웨어가 필요합니다.
어떤 스프레드시트 형식이 사용됩니까?
출력은 Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers 및 대부분의 기타 스프레드시트 애플리케이션과 호환되는 .xlsx 파일(Office Open XML 스프레드시트 형식)입니다.

Related Tools