OpenPDFTools

המרת PDF ל-Excel אונליין בחינם

חלץ טקסט ונתונים טבלאיים מקובצי PDF והמר אותם לגיליונות אלקטרוניים של Excel (.xlsx). הכלי מנתח את פריסת הטקסט כדי לזהות שורות ועמודות, מה שמקל על עבודה עם נתוני PDF בגיליון. ⚡

שחרר קבצים כאן או לחץ לעיון

עד 200 MB לקובץ - עובד לוקלי

איך זה עובד

1

העלה את קובץ ה-PDF שלך

2

טבלאות מזוהות ומחולצות אוטומטית

3

הורד את גיליון ה-Excel (.xlsx)

איך עובדת המרת PDF ל-Excel?

המרת PDF ל-Excel מחלצת טקסט מהמסמך, מנתחת את הפריסה המרחבית לזיהוי שורות ועמודות, ויוצרת גיליון אלקטרוני .xlsx מובנה. הכלי מזהה נתונים טבלאיים על ידי בחינת מיקום אלמנטי הטקסט בכל עמוד. אלמנטים על אותו קו אופקי הופכים לשורה, ומרווחים עקביים בין קבוצות מגדירים גבולות עמודות.

צינור החילוץ רץ כולו בדפדפן. PDF.js קורא את המסמך ומחזיר פריטי טקסט עם קואורדינטות x/y. קוד ניתוח הפריסה שלנו מקבץ פריטים אלה לשורות ועמודות על בסיס מיקומם. ספריית xlsx יוצרת גיליון אלקטרוני עם המבנה שזוהה. לטבלאות מעוצבות היטב עם מרווחי עמודות ברורים, דיוק הזיהוי הוא בדרך כלל מעל 90%. טבלאות מורכבות עם תאים ממוזגים או מרווחים לא סדירים עשויות לדרוש התאמה ידנית.

נתונים שאנשים מחלצים באופן קבוע מ-PDF לגיליונות אלקטרוניים:

  • דוחות כספיים ודוחות רבעוניים עם טבלאות הכנסות
  • פריטי חשבוניות עם שמות מוצרים, כמויות ומחירים
  • גליונות ציונים אקדמיים ורשומות סטודנטים מפורטלי אוניברסיטה
  • קטלוגי מוצרים עם מפרטים מאורגנים בעמודות
  • דוחות סטטיסטיים ממשלתיים עם טבלאות נתונים דמוגרפיים או כלכליים

שירותי חילוץ בענן משתמשים באלגוריתמים מתוחכמים יותר (לפעמים כולל AI) ויכולים להתמודד עם פריסות טבלאיות מבולגנות יותר. המחיר הוא העלאת הדוחות הכספיים או נתוני הלקוח שלך לשרת שאינו בשליטתך. לטבלאות פשוטות עם מרווחי עמודות רגילים, החילוץ מבוסס הדפדפן שלנו משתווה לאיכות ענן. לדוחות מורכבים עם טבלאות מקוננות, ייתכן שתצטרך לתקן את פלט הגיליון ידנית.

אם ה-PDF מכיל בעיקר טקסט ולא טבלאות, PDF ל-Word מתאים יותר. אחרי חילוץ נתונים ל-Excel, אולי תרצה לפצל את ה-PDF המקורי כדי לשמור רק את העמודים הרלוונטיים, או לדחוס אותו לפני ארכיון.

למה OpenPDFTools?

פרטיות 100%

הקבצים שלך לא עוזבים את ההתקן שלך. כל העיבוד מתרחש לוקלי בדפדפן שלך באמצעות טכנולוגיית WebAssembly. אפס אוסף נתונים, אפס סיכון לפרטיות.

חינם לגמרי

ללא דרישה להרשמה. ללא עמלות נסתרות. ללא מגבלות קבצים. ללא סימני מים. פשוט הכלים שאתה צריך, כאשר אתה זקוק להם.

מהיר בזק

ללא זמן המתנה להעלאה/הורדה. קבצים עובדו מיידית בהתקן שלך. אפילו קבצים גדולים מעובדים תוך שניות.

שאלות נפוצות

איך עובד זיהוי הטבלאות?
הכלי מחלץ טקסט מה-PDF ומנתח את המיקום המרחבי של כל אלמנט טקסט. אלמנטים על אותו קו אופקי הופכים לשורה, ומרווחים בין אלמנטים מגדירים גבולות עמודות. זה עובד היטב לטבלאות מעוצבות בבירור.
טבלאות מורכבות יומרו בדיוק?
הכלי עובד הכי טוב עם טבלאות פשוטות ומובנות היטב. טבלאות מורכבות עם תאים ממוזגים, טבלאות מקוננות, או פריסות לא סדירות עשויות שלא להמיר בצורה מושלמת. ייתכן שתצטרך לתקן את הגיליון ידנית אחרי ההמרה.
אפשר להמיר PDF עם מספר טבלאות?
כן. כל תוכן הטקסט מכל העמודים מחולץ לגיליון אלקטרוני אחד. טבלאות מעמודים שונים יופיעו כשורות עוקבות. אפשר להפריד אותן לפי הצורך באפליקציית הגיליון.
מה עם טבלאות PDF סרוקות?
קובצי PDF סרוקים שמכילים תמונות של טבלאות לא ניתנים לעיבוד על ידי כלי זה, כי אין טקסט ניתן לחילוץ. תצטרך תוכנת OCR כדי להמיר את התמונות הסרוקות לטקסט קודם.
באיזה פורמט גיליון אלקטרוני מדובר?
הפלט הוא קובץ .xlsx (פורמט Office Open XML Spreadsheet), תואם ל-Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers, ורוב אפליקציות הגיליון האלקטרוני האחרות.

כלים קשורים