Schlagwort: OCR

Qualität der Texterkennung bei OCR-Webservice verbessert

Auch bestehende Funktionen, wie das Erkennen von Texten (OCR) in PDF-Dokumenten oder Grafiken wird mit dem neusten Update (Revisionsnummer 2159) von webPDF verbessert. Wir bieten jetzt die Möglichkeit, dass Ihr Dokument, vor der Texterkennung, aufbereitet (optimiert) wird, um somit das Ergebnis zu optimieren. Durch Anwendung von verschiedenen Grafikoperationen auf das Ausgangsdokument (Grafik oder PDF), wird…




webPDF 8: Erstes Update mit neuen Funktionen

Nach dem Release von webPDF 8.0 im November letzten Jahres, steht jetzt das erste Update zur Verfügung. Mit der Revisionsnummer 2058 steht ab sofort im Download die neue Version zur Verfügung, die neben Bugfixes auch ein einige neue Funktionen bringt…




OCR Webservice

OCR Schrifterkennung/Texterkennung mit wsclient Bibliothek nutzen: Wie kann man die Webservices von webPDF mit der wsclient Bibliothek konkret nutzen? Das wollen wir hier an einem konkreten Coding-Beispiel zeigen. Hier soll es konkret um den OCR Webservice gehen. Wichtiger Hinweis: Das nun folgende Coding-Beispiel beruht auf der Nutzung der webPDF wsclient Bibliothek. Um das Beispiel zu…




How-to: Einsatz des OCR-Webservices von webPDF 7

In diesem Beispiel wird die Nutzung des OCR-Webservices von webPDF vorgestellt. Die OCR-Funktionen in webPDF basieren auf tesseract.  Standartmäßig werden die Sprachen Deutsch,  Englisch, Französisch, Spanisch und Italienisch unterstützt. Sprachen lassen sich im tesseract-Ordner hinzufügen (Näheres dazu in der Anleitung von webPDF). Nicht unterstützt werden momentan Sprachen mit einem „Multibyte Character Set“. Dies betrifft zum…




OCR – Optische Zeichenerkennung mit webPDF

Im webPDF Portal hat man die Möglichkeit, basierend auf dem Webservice OCR, den Dienst zur optischen Texterkennung von Grafiken zu nutzen. Optische Zeichenerkennung (OCR) OCR kommt immer dann zum Einsatz wenn auf grafische Dateiformate eine optische Zeichenerkennung angewendet werden soll und anschließend als PDF, Textdatei oder XML abgelegt werden soll. Auf gut Deutsch: Grafiken können…




How-to: PDF Dokumente bearbeiten mit webPDF

Mit webPDF kann man nicht nur mehr als 100 verschiedene Formate konvertieren. Es ist auch problemlos möglich, geschäftliche E-Mails rechtssicher zu archivieren, Grafiken, Scan- & Faxdokumente bearbeitbar zu machen oder PDF-Dokumente mit Signaturen und Zeitstempeln zu versehen. Mit webPDF lassen sich Dokumente im PDF/A-Standard (ISO 19005) erstellen oder überprüfen, um die PDF-Dokumente bei der Archivierung…




Grafische Texte in durchsuchbare PDFs konvertieren

Optische Eingabegeräte, gemeint sind hier Geräte wie Scanner und Digitalkameras, erzeugen überwiegend Rastergrafiken. Die so erzeugten Grafiken können durchaus auch Texte enthalten, die aber nicht mehr durch den Computer verarbeitet werden können. Eine Editierung der Texte oder eine Suche innerhalb dieser ist in den grafischen Formaten wie .png oder .jpg nicht möglich. Grafische Texte kostenlos…


Tags:


Grafische Texte mit webPDF und OCR in bearbeitbare PDF-Dokumente konvertieren

Im Betriebsablauf fallen häufig Dokumente an, die zwar Texte enthalten, aber in einem Format vorliegen, das die computergestützte Textverarbeitung nicht unterstützt. Dabei handelt es sich meistens um Grafiken aus optischen Eingabegeräten, wie Scannern, Digitalkameras und Faxempfängern, die überwiegend Rastergrafiken als Ergebnis hervorbringen. Um die in den Grafiken enthaltenen Texte effizient nutzen zu können, müssen diese…


Tags:


OCR im Wandel der Zeiten

OCR im Wandel der Zeiten: Vor 45 Jahren wurde im Auftrag der amerikanischen Regierung die erste maschinenlesbare Schrift entwickelt. Bis zum heutigen Stand der OCR-Technik hat sich viel verändert. 1968 war ein revolutionäres Jahr – nicht nur politisch, auch in der Geschichte des Computers hat sich in diesem Jahr einiges bewegt. Douglas C. Engelbart erfand…


Tags:


OCR: webPDF wandelt Grafiken in aufgelöste Dokumente um

Mittels OCR Faxe in den Workflow integrieren Dank OCR-Texterkennung können PDF-Dokumente in echte Text-Dokumente umgewandelt werden: Auch im digitalen Zeitalter hat das Fax nicht komplett an Bedeutung verloren und findet weiterhin in spezifischen Abläufen Verwendung. Das Problem: Die Dokumente liegen nach dem Einscannen entweder als Grafikdateien oder aber als PDF-Dokumente, die nur Grafiken und keine Inhalte…