Skip to main content

What is OCR für PDFs?

OCR (Optical Character Recognition, optische Zeichenerkennung) wandelt Text in einem Bild – wie bei einem gescannten PDF – in maschinenlesbaren Text um. Bei PDF-Formularen erkennen moderne OCR-Systeme auch Feldgrenzen, Kontrollkästchen und Unterschriftsbereiche, sodass ein flach gescanntes PDF ausfüllbar wird.

Warum OCR bei Formularen wichtig ist

Die Hälfte der PDFs, die in der Praxis anfallen, sind flache Scans – ausgedruckte Formulare, die jemand eingescannt und per E-Mail verschickt hat. Ohne OCR sieht ein Programm nur Pixel. Mit OCR kann das Programm die Feldbezeichnungen lesen („Name“, „Geburtsdatum“, „Reisepassnummer“), die leeren Kästen daneben finden und den Scan wie ein ausfüllbares Formular behandeln.

Was moderne OCR neben der Texterkennung leistet

Ältere OCR-Systeme konnten nur Text erkennen. Moderne Systeme kombinieren die Zeichenerkennung mit layout-sensitiven Bilderkennungsmodellen, die Bereiche der Seite klassifizieren: Dieser Bereich ist ein Textfeld, dies ist ein Kontrollkästchen und das eine Unterschriftszeile. Genau diese Layout-Erkennung macht aus einem reinen Texterkennungswerkzeug eine Software zum Ausfüllen von Formularen.

Wo OCR an ihre Grenzen stößt

Die Qualität ist entscheidend. Ein scharfer 300-dpi-Scan funktioniert fast perfekt – ein Handyfoto, das schräg und bei schlechtem Licht aufgenommen wurde, hingegen nicht. Handschriftliche Feldbezeichnungen, Scans in Faxqualität und Formulare, die mehrere Sprachen auf einer Seite mischen, sind ebenfalls schwierig zu verarbeiten. Die Lösung dafür ist mehrstufig: eine bessere OCR für die einfachen Fälle, mehrsprachig trainierte Bilderkennungsmodelle für die schwierigen und ein manueller Prüfschritt für die Grenzfälle.

Wie FillWizard OCR einsetzt

Wenn Sie ein flaches PDF hochladen, führt FillWizard eine OCR und eine Layout-Analyse durch. Das System erkennt Felder in fünf Sprachen, einschließlich arabischer Formulare mit Rechts-nach-links-Schrift. Die erkannten Felder werden mit den Daten aus Ihrem Identitätsprofil abgeglichen. Vor dem Export sehen Sie einen Prüfschritt, in dem alle unsicher erkannten Felder markiert sind, sodass Sie sie korrigieren können – die Werte werden über den Originalscan gelegt und als flaches PDF exportiert.

Related terms