Grafische Texte mit webPDF und OCR in bearbeitbare PDF-Dokumente konvertieren

Im Betriebsablauf fallen häufig Dokumente an, die zwar Texte enthalten, aber in einem Format vorliegen, das die computergestützte Textverarbeitung nicht unterstützt. Dabei handelt es sich meistens um Grafiken aus optischen Eingabegeräten, wie Scannern, Digitalkameras und Faxempfängern, die überwiegend Rastergrafiken als Ergebnis hervorbringen. Um die in den Grafiken enthaltenen Texte effizient nutzen zu können, müssen diese mithilfe von OCR in maschinenlesbare Zeichen umgewandelt werden. Im Anschluss können die Texte wie gewohnt mit einem Textverarbeitungsprogramm editiert, kopiert und durchsucht werden. Die automatische Texterkennung spart wertvolle Zeit und somit auch Geld.

 

Was ist OCR?

OCR steht für Optical Character Recognition und beschreibt den Vorgang der Texterkennung aus der Informationstechnik. Dabei findet zunächst eine Analyse des gesamten Dokuments statt, in der relevante Bereiche wie Textblöcke gesucht werden. Im Anschluss wird der eigentliche Vorgang der Zeichenerkennung gestartet, in dem zunächst separate Zeichen erkannt und mit einem Mustervergleich bestimmt werden. Das Ergebnis der optischen Zeichenerkennung (OCR) ist ein maschinenlesbarer Text.

Den Workflow mit webPDF und OCR verbessern

webPDF stellt eine Funktion bereit, die es Ihnen ermöglicht, aus grafischen Texten durchsuchbare und editierbare textliche PDF-Dokumente zu erstellen. Eine aufwendige Verschriftlichung des Inhalts oder das ineffiziente Arbeiten mit bildlichen Textdokumenten gehören somit der Vergangenheit an.
Betriebsabläufe (Workflows), bei denen es darauf ankommt, dass Dokumente schnell identifiziert, effizient verarbeitet und wiederauffindbar archiviert werden können, können mithilfe der Umwandlung von bildlichen zu textlichen Schriftformaten deutlich effizienter gestaltet werden. Der zentrale Einsatz der webPDF-Software ermöglicht die nahtlose Integration aller bildlichen Texte in die elektronische Datenverarbeitung des Unternehmens. Alle Arbeits- und Kommunikations-, wie auch alle Archivierungsprozesse können durch den serverseitigen Einsatz der OCR-Funktionen von webPDF deutlich schneller, sicherer und komfortabler umgesetzt werden. Die Workflows des Unternehmens werden durch die ständige Zugriffsmöglichkeit auf die OCR-Operationen beschleunigt und gesichert.

webPDF stellt zusätzlich eine Automatisierung der OCR-Funktion durch Webservices zur Verfügung. Eine passgenaue Integration in die Arbeitsabläufe Ihres Unternehmens ist somit garantiert.