OCR – Optische Zeichenerkennung mit webPDF

Im webPDF Portal hat man die Möglichkeit, basierend auf dem Webservice OCR, den Dienst zur optischen Texterkennung von Grafiken zu nutzen.

Optische Zeichenerkennung (OCR)

OCR kommt immer dann zum Einsatz wenn auf grafische Dateiformate eine optische Zeichenerkennung angewendet werden soll und anschließend als PDF, Textdatei oder XML abgelegt werden soll. Auf gut Deutsch: Grafiken können mit OCR in durchsuchbare PDF-Dokumente umgewandelt werden. Das findet beispielsweise dann Anwendung, wenn Scans (gescannte Eingangspost) auf bestimmte Begriffe durchsuchbar sein sollen und die Scans automatisch in den Arbeitsprozess integriert, also auch zugeordnet werden sollen.

Wie läuft die optische Texterkennung im webPDF Portal ab?

Man legt das Ausgabeformat (PDF / Text oder XML) sowie die Sprache fest. Danach kann man die Texterkennung der Grafikdatei starten.

Optische Zeichenerkennung

Beachten Sie immer die Festlegung der Ausgangssprache, da sonst unter Umständen Sonderzeichen nicht richtig erkannt werden können.

Hier finden Sie weitere Infos zum Thema:

https://www.webpdf.de/blog/grafische-texte-mit-webpdf-und-ocr/

https://www.webpdf.de/blog/ocr-im-wandel-der-zeiten/

https://www.webpdf.de/blog/ocr-texterkennung/