Το κείμενο σε σαρωμένο PDF δεν επιλέγεται - Πώς να το διορθώσετε με OCR

Γιατί δεν μπορείτε να επιλέξετε κείμενο σε σαρωμένο PDF;
Όταν ένα έγγραφο σαρώνεται φυσικά και αποθηκεύεται ως PDF, ο σαρωτής καταγράφει μια επίπεδη εικόνα της σελίδας - ακριβώς όπως μια φωτογραφία. Το προκύπτον αρχείο δεν περιέχει πραγματικούς χαρακτήρες κειμένου, μόνο εικονοστοιχεία διατεταγμένα ώστε να μοιάζουν με γράμματα. Γι’ αυτό κάνοντας κλικ οπουδήποτε στο έγγραφο δεν επιλέγεται τίποτα: δεν υπάρχει επίπεδο κειμένου για να πιαστεί ο κέρσορας.
Αυτό είναι ένα από τα πιο συνηθισμένα προβλήματα με PDF. Το έγγραφο φαίνεται απόλυτα αναγνώσιμο στην οθόνη, αλλά ουσιαστικά είναι μια φωτογραφία ενσωματωμένη σε ένα PDF περίβλημα. Δεν μπορείτε να το αναζητήσετε, να αντιγράψετε από αυτό ή να αφήσετε ένα πρόγραμμα ανάγνωσης οθόνης να το επεξεργαστεί.
Τι είναι το OCR και πώς το διορθώνει;
Το OCR (Οπτική Αναγνώριση Χαρακτήρων) είναι μια τεχνολογία που αναλύει την εικόνα κειμένου και τη μετατρέπει σε πραγματικούς, αναγνώσιμους από μηχανή χαρακτήρες. Το λογισμικό εξετάζει τα σχήματα των γραμμάτων, τα συγκρίνει με γνωστά μοτίβα και παράγει ένα επίπεδο κειμένου που ενσωματώνεται πίσω στο PDF.
Μετά την επεξεργασία OCR, λαμβάνετε ένα PDF με δυνατότητα αναζήτησης και επιλογής - οπτικά πανομοιότυπο με το πρωτότυπο, αλλά τώρα ο κέρσορας μπορεί να επισημάνει λέξεις, το Ctrl+F μπορεί να βρει φράσεις και η αντιγραφή-επικόλληση λειτουργεί κανονικά. Τα προγράμματα ανάγνωσης οθόνης και τα εργαλεία προσβασιμότητας μπορούν επίσης να το διαβάσουν.
Πώς να εφαρμόσετε OCR σε σαρωμένο PDF
Υπάρχουν αρκετοί τρόποι για να προσθέσετε OCR σε ένα σαρωμένο PDF, από δωρεάν εργαλεία προγράμματος περιήγησης έως λογισμικό για υπολογιστή:
- Μετατροπή σε Word και αποθήκευση ως PDF: Ο μετατροπέας PDF σε Word εξάγει το οπτικό περιεχόμενο και το μετατρέπει σε επεξεργάσιμο έγγραφο Word. Στο Word, το κείμενο είναι πλήρως επιλέξιμο. Στη συνέχεια μπορείτε να το εξάγετε ξανά σε PDF με σωστό επίπεδο κειμένου.
- Adobe Acrobat (επί πληρωμή): Το βιομηχανικό πρότυπο. Ανοίξτε το PDF, μεταβείτε σε Εργαλεία → Σάρωση και OCR → Αναγνώριση κειμένου, και το Acrobat προσθέτει ένα επίπεδο κειμένου απευθείας. Ακριβό αλλά εξαιρετικά ακριβές.
- Google Drive (δωρεάν): Ανεβάστε το σαρωμένο PDF στο Google Drive, κάντε δεξί κλικ και επιλέξτε "Άνοιγμα με Google Docs". Το Google εκτελεί OCR αυτόματα και ανοίγει το κείμενο σε έγγραφο Docs. Λειτουργεί εκπληκτικά καλά για καθαρές σαρώσεις.
- Tesseract OCR (δωρεάν, ανοιχτού κώδικα): Ένας ισχυρός μηχανισμός OCR γραμμής εντολών που χρησιμοποιείται από πολλές εφαρμογές. Καλύτερος για προγραμματιστές ή τεχνικούς χρήστες που θέλουν δωρεάν λύση αυτόνομης φιλοξενίας.
- Adobe Acrobat online (περιορισμένα δωρεάν): Το Adobe προσφέρει περιορισμένη δωρεάν επεξεργασία OCR μέσω των διαδικτυακών εργαλείων του για χρήστες χωρίς συνδρομή.
Συμβουλές για καλύτερη ακρίβεια OCR
Η ποιότητα OCR εξαρτάται σε μεγάλο βαθμό από την ποιότητα της αρχικής σάρωσης. Ακολουθήστε αυτές τις συμβουλές για μέγιστη ακρίβεια:
- Σαρώστε στα 300 DPI ή υψηλότερα: Σαρώσεις χαμηλής ανάλυσης παράγουν θολούς χαρακτήρες που οι μηχανισμοί OCR διαβάζουν λανθασμένα. Τα 300 DPI είναι το ελάχιστο· τα 600 DPI είναι ιδανικά για μικρό κείμενο ή λεπτομερή έγγραφα.
- Χρησιμοποιήστε ασπρόμαυρο για έγγραφα κειμένου: Οι έγχρωμες σαρώσεις αυξάνουν το μέγεθος του αρχείου χωρίς να βελτιώνουν την ακρίβεια OCR για απλό κείμενο. Το ασπρόμαυρο ή γκρίζο αρκεί για τα περισσότερα έγγραφα.
- Κρατήστε τις σελίδες ευθείες: Οι κεκλιμένες ή στριμμένες σελίδες μπερδεύουν το λογισμικό OCR. Τα περισσότερα σύγχρονα εργαλεία μπορούν να ευθυγραμμίσουν αυτόματα, αλλά η εκκίνηση με ευθεία σελίδα βοηθά.
- Αποφύγετε λεκέδες καφέ και μουτζούρες: Τα φυσικά σημάδια στο έγγραφο διαβάζονται λανθασμένα ως χαρακτήρες. Καθαρίστε το πρωτότυπο αν είναι δυνατό.
- Ελέγξτε την έξοδο: Το OCR δεν είναι 100% ακριβές. Πάντα διορθώνετε το αποτέλεσμα, ειδικά για αριθμούς, στίξη και χειρόγραφες ενότητες.
Μετά το OCR: μειώστε το μέγεθος αρχείου αν χρειάζεται
Η επεξεργασία OCR μπορεί μερικές φορές να αυξήσει το μέγεθος του PDF αρχείου επειδή προσθέτει ένα κρυφό επίπεδο κειμένου πάνω από το υπάρχον επίπεδο εικόνας. Εάν το προκύπτον αρχείο είναι πολύ μεγάλο, χρησιμοποιήστε τον συμπιεστή PDF μας για να μειώσετε το μέγεθος χωρίς απώλεια οπτικής ποιότητας.
Τι γίνεται αν το OCR δεν αναγνωρίζει σωστά το κείμενο;
Η ακρίβεια OCR εξαρτάται από την ποιότητα της αρχικής σάρωσης. Κακά αποτελέσματα είναι συνηθισμένα με: πολύ μικρές γραμματοσειρές (κάτω από 8pt), χειρόγραφο κείμενο, διακοσμητικές ή ασυνήθιστες γραμματοσειρές, ξεθωριασμένο μελάνι ή σαρώσεις χαμηλής ποιότητας κάτω από 200 DPI. Σε αυτές τις περιπτώσεις, η χειροκίνητη αναπληκτρολόγηση μπορεί να είναι απαραίτητη - ή επανασάρωση του αρχικού εγγράφου σε υψηλότερη ποιότητα πριν εκτελέσετε ξανά OCR.
Συχνές Ερωτήσεις
Γιατί το κείμενο στο PDF μου δεν επιλέγεται;▾
Υπάρχει δωρεάν τρόπος να κάνω το κείμενο σε σαρωμένο PDF επιλέξιμο;▾
Αλλάζει το OCR την εμφάνιση του PDF;▾
Πόσο ακριβές είναι το OCR σε σαρωμένα έγγραφα;▾
Μπορώ να κάνω χειρόγραφο κείμενο PDF επιλέξιμο με OCR;▾
Σχετικά Άρθρα
Λείπουν ενσωματωμένες γραμματοσειρές στο PDF; Διορθώστε την εσφαλμένη εμφάνιση κειμένου σε 7 βήματα
Εάν το κείμενο PDF σας φαίνεται διαφορετικό σε άλλη συσκευή, ο λόγος είναι συνήθως η έλλειψη ενσωματωμένων γραμματοσειρών. Δείτε πώς μπορείτε να το διαγνώσετε και να το διορθώσετε γρήγορα. ✅
6 λεπτά ανάγνωσηςΤο PDF γίνεται θολό μετά τη συμπίεση; 7 τρόποι για να διατηρήσετε την ποιότητα (2026)
Συμπιέστηκε ένα PDF και τώρα το κείμενο ή οι εικόνες φαίνονται θολά; Μάθετε ακριβώς γιατί πέφτει η ποιότητα και πώς να μειώσετε το μέγεθος του αρχείου χωρίς να καταστρέψετε την αναγνωσιμότητα. ✅
6 λεπτά ανάγνωσηςΔεν μπορείτε να ανοίξετε το PDF σε iPhone ή Android; 6 Άμεσες επιδιορθώσεις (2026)
Δυσκολεύεστε να ανοίξετε ένα αρχείο PDF στο iPhone ή το Android σας; Μάθετε γιατί μπορεί να βλέπετε μια κενή οθόνη και πώς να προβάλλετε τα έγγραφά σας χωρίς να εγκαταστήσετε βαριές εφαρμογές. ✅
5 λεπτά ανάγνωσης