OCR: webPDF wandelt Grafiken in aufgelöste Dokumente um

Mittels OCR Faxe in den Workflow integrieren

Dank OCR-Texterkennung können PDF-Dokumente in echte Text-Dokumente umgewandelt werden: Auch im digitalen Zeitalter hat das Fax nicht komplett an Bedeutung verloren und findet weiterhin in spezifischen Abläufen Verwendung. Das Problem: Die Dokumente liegen nach dem Einscannen entweder als Grafikdateien oder aber als PDF-Dokumente, die nur Grafiken und keine Inhalte enthalten, vor. Dadurch lassen sie sich nicht in den Workflow integrieren. Hierzu müssen die entsprechenden Grafikdokumente erst wieder – mittels der sogenannten OCR-Texterkennung (Optical Character Recognition) – in aufgelöste PDF-Dokumente umgewandelt werden, wodurch diese dann wieder gezielt nach Begriffen durchsucht und somit in den Workflow des Unternehmens integriert werden können. webPDF bietet die Möglichkeit aus digital erfassten Faxen PDF-Dokumente zu erstellen, die eben nicht nur ein visuelles Abbild enthalten, sondern auch den Inhalt als Text.    

Der Umgang mit Faxen kann im Arbeitsalltag bisweilen mühsam sein. Denn selbst wenn das Fax in digitaler Form als PDF-Dokument vorliegt – wie es heute in der Regel automatisch der Fall ist oder mit Hilfe von Scannern bewerkstelligt wird  – müssen relevante Inhalte häufig per Hand aus den Dokumenten übertragen werden. Das kostet Zeit und liegt daran, dass diese als Grafikdokumente nicht mehr durchsucht werden können. Denn bei den PDF-Dokumenten handelt es sich zumeist nur um „Wrapper“ für die Grafiken – sie sind also nicht mehr als ein Transportmittel für die gescannten Dokumente. Soll nun beispielsweise eine Auftrags- oder Kundennummer zu Dokumentationszwecken in einem oder mehreren Dokumenten ermittelt werden, ist dies problematisch und zeitaufwendig.

Um die PDF-Dokumente wieder durchsuchbar und das Auffinden einzelner Begriffe zu ermöglichen, müssen diese erst mithilfe von OCR-Texterkennung in PDF-Dokumente umgewandelt werden, welche nicht nur ein visuelles Abbild des jeweiligen Faxes beinhalten, sondern auch den Inhalt als Text. Auf diesem Wege lassen sich die Texte wie gewohnt markieren und kopieren sowie Faxe generell in den Workflow integrieren bzw. automatisch zuordnen. webPDF bietet zusätzlich die Option, im Zuge des OCR-Vorgangs gar nicht erst ein neues PDF-Dokument zu erstellen, sondern direkt auf den textlichen Inhalt – z.B. als XML-Dokument – zuzugreifen, um diesen gezielt weiter zu verarbeiten. Die Möglichkeiten der OCR-Texterkennung lassen sich außerdem auf Grafikformate, wie TIFF, JPEG oder PNG, anwenden. Insgesamt eine gute Möglichkeit für Unternehmen, um Prozesse zu optimieren – und die Integration von Faxen zu ermöglichen.