Qualität der Texterkennung bei OCR-Webservice verbessert

Minimum technical requirements

  • Java version: 11
  • webPDF version: 8 (revision 2159)

Auch bestehende Funktionen, wie das Erkennen von Texten (OCR) in PDF-Dokumenten oder Grafiken wird mit dem neusten Update (Revisionsnummer 2159) von webPDF verbessert. Wir bieten jetzt die Möglichkeit, dass Ihr Dokument, vor der Texterkennung, aufbereitet (optimiert) wird, um somit das Ergebnis zu optimieren.

Durch Anwendung von verschiedenen Grafikoperationen auf das Ausgangsdokument (Grafik oder PDF), wird ein verbessertes Basisdokument für die eigentliche Texterkennung erstellt.

Über die neuen Optionen können Sie Bilder und PDF-Dokumente aufhellen, schärfen, störende Elemente automatisiert entfernen und weiteres mehr. Diese Optimierungen sind alle nur temporär aktiv während der Texterkennung, Ihr Ausgangsdokument bleibt also unverändert.

Die Erkennungsergebnisse können somit grade bei schwierigen Dokumenten, die zum Beispiel verschwommen sind oder viele störende Elemente im Hintergrund haben, stark verbessert werden.

Unterstützt werden diese neuen (optionalen) Operationen über den OCR-Webservice des webPDF-Servers und über den Dialog „Text erkennen“ im Portal unter dem Tab „Optimierung“.