Durchsuchbare PDF-Dokumente mit OCR erstellen

Mit OCR-Funktionen Grafiken, Scan- und Fax-Dokumente in durchsuchbare und bearbeitbare PDF-Dokumente umwandeln.

webPDF verfügt über eine PDF-OCR-Funktion und ermöglicht es Ihnen somit, Texte aus Grafikdokumenten in einen durchsuchbaren und bearbeitbaren Text umzuwandeln. Eingescannte und nur bildlich vorliegende Texte lassen sich mittels der OCR-Erkennung auslesen und in eine textliche PDF-Datei umwandeln. Die Probleme der Überführung von physischen Dokumenten auf den digitalen Kommunikationsweg lassen sich somit überwinden. Aufwendige Verschriftlichungen und das ineffiziente Arbeiten mit bildlichen Textdokumenten entfallen mit der automatisierten Verschriftlichungsfunktion der webPDF-Engine.

Grafiken, Scan- und Faxdokumente wieder bearbeitbar machen

Eingescannte Schriftstücke, Faxe und als Bilddatei oder PDF gespeicherte Dokumente können durch die zentrale Implementierung der webPDF-Server-Engine vollwertig in den digitalen Workflow Ihres Unternehmens integriert werden. Ausgelesene Bilddateien, welche Text enthalten, lassen sich vollständig mit in die digitale Textverarbeitung Ihrer Mitarbeiter einbeziehen. Das effiziente Durchsuchen von Texten, das Kopieren bestimmter Stellen, die Markierung, Bearbeitung und Weiterverwendung von Textfragmenten wird dank der PDF-OCR-Funktion auch für Datenbestände möglich, die ursprünglich nur als Foto, Scan oder Grafik vorlagen. Hochauflösende Ausleseoperationen erlauben maschinenlesbare Übersetzungen auch für Bilddateien von nur mäßiger Qualität.

Workflows effektiver gestalten

Betriebsabläufe (Workflows), bei denen es darauf ankommt, dass Dokumente schnell identifiziert, effizient verarbeitet und wiederauffindbar archiviert werden können, können mithilfe der Umwandlung von bildlichen zu textlichen Schriftformaten deutlich effizienter gestaltet werden. Der zentrale Einsatz der webPDF-Software ermöglicht die nahtlose Integration aller bildlichen Texte in die elektronische Datenverarbeitung des Unternehmens. Sowohl alle Arbeits- und Kommunikations- als auch jedwede Archivierungsprozesse können durch den serverseitigen Einsatz der OCR-Funktionen von webPDF deutlich schneller, sicherer und komfortabler umgesetzt werden. Die Workflows des Unternehmens werden durch die ständige Zugriffsmöglichkeit auf die OCR-Operationen beschleunigt und gesichert.

Automatisierung der OCR-Funktion durch Webservice

Der webPDF-Server erstellt zentral organisiert aus den Text-Bilddateien des tagtäglichen Dokumentenverkehrs maschinenlesbare Textdateien. Sowohl die Konvertierung in das PDF-Format als auch die Direktausgabe von Texten wird durch die zentrale Bereitstellung der OCR-Funktionen per Webservice ermöglicht. Die entwicklerfreundliche Software-Architektur stellt sicher, dass sich alle beinhalteten Funktionen präzise in die Arbeitsabläufe Ihres Unternehmens integrieren lassen:

  • webPDF verfügt über Funktionen zur optischen Texterkennung verschiedener Grafikformate (TIFF, JPEG, PNG).
  • Deutsch, Englisch, Französisch, Italienisch und Spanisch werden erkannt und konvertiert.
  • PDF-Dokumente, die bildlichen Text enthalten, können in eine durchsuchbare Version übersetzt werden.
  • Gescannte Schriftstücke und Faxe werden mittels der serverseitigen Prozesse ausgelesen und übersetzt.
  • Die integrierte PDF-OCR-Funktion erlaubt neben der Ausgabe einer PDF-Datei auch die Direktausgabe von ausgelesenen Textinhalten (z. B. als XML-Dokument).