14 posts tagged with "OCR"

View All Tags

Grafische Texte mit webPDF und OCR in bearbeitbare PDF-Dokumente konvertieren

Buchstabenwürfel TEXT

Im Betriebsablauf fallen häufig Dokumente an, die zwar Texte enthalten, aber in einem Format vorliegen, das die computergestützte Textverarbeitung nicht unterstützt. Dabei handelt es sich meistens um Grafiken aus optischen Eingabegeräten, wie Scannern, Digitalkameras und Faxempfängern, die überwiegend Rastergrafiken als Ergebnis hervorbringen. Um die in den Grafiken enthaltenen Texte effizient nutzen zu können, müssen diese mithilfe von OCR in maschinenlesbare Zeichen umgewandelt werden. Im Anschluss können die Texte wie gewohnt mit einem Textverarbeitungsprogramm editiert, kopiert und durchsucht werden. Die automatische Texterkennung spart wertvolle Zeit und somit auch Geld.

OCR im Wandel der Zeiten

Bild von Scheck

OCR im Wandel der Zeiten: Vor 45 Jahren wurde im Auftrag der amerikanischen Regierung die erste maschinenlesbare Schrift entwickelt. Bis zum heutigen Stand der OCR-Technik hat sich viel verändert.

1968 war ein revolutionäres Jahr - nicht nur politisch, auch in der Geschichte des Computers hat sich in diesem Jahr einiges bewegt. Douglas C. Engelbart erfand die Computermaus, der erste Vorläufer unserer Personal Computer kam auf den Markt, und die elektronische Datenverarbeitung wurde langsam marktfähig.

OCR: webPDF wandelt Grafiken in aufgelöste Dokumente um

Scanner Leucht-Tastatur

Mittels OCR Faxe in den Workflow integrieren

Dank OCR-Texterkennung können PDF-Dokumente in echte Text-Dokumente umgewandelt werden: Auch im digitalen Zeitalter hat das Fax nicht komplett an Bedeutung verloren und findet weiterhin in spezifischen Abläufen Verwendung. Das Problem: Die Dokumente liegen nach dem Einscannen entweder als Grafikdateien oder aber als PDF-Dokumente, die nur Grafiken und keine Inhalte enthalten, vor. Dadurch lassen sie sich nicht in den Workflow integrieren. Hierzu müssen die entsprechenden Grafikdokumente erst wieder - mittels der sogenannten OCR-Texterkennung (Optical Character Recognition) - in aufgelöste PDF-Dokumente umgewandelt werden, wodurch diese dann wieder gezielt nach Begriffen durchsucht und somit in den Workflow des Unternehmens integriert werden können. webPDF bietet die Möglichkeit aus digital erfassten Faxen PDF-Dokumente zu erstellen, die eben nicht nur ein visuelles Abbild enthalten, sondern auch den Inhalt als Text.** **