DENKnet OCR - stabile Zeichenerkennung ohne Verwechslungsgefahr

OCR-Ergebnisse berücksichtigen durch neue Output-Filter nun auch Zusammenhänge einzelner Zeichen

Gedruckten oder handgeschriebenen Text aus Kamerabildern in maschinenlesbare Textdaten zu konvertieren zählt noch immer zu den herausforderndsten Aufgaben für OCR-Systeme. Insbesondere in der Erkennung sehr ähnlicher Zeichen trennt sich die Spreu vom Weizen. Verwechslungen von Zeichen, wie "O" und  "0" oder eine “4”, die als “A” erkannt wird, sind selbst durch sehr gute Ausgangsdaten kaum auszuschließen.

Das Deep-OCR-Modell der DENKnet OCR ist für derartige Extremfälle vorbereitet. Es erkennt nicht nur einzelne Zeichen, sondern berücksichtigt nun auch deren Zusammenhänge mit extrem hoher Zuverlässigkeit. Möglich machen das neue Output-Filter, mit denen das Format eines Ergebniswortes, das ausschließlich angezeigt werden soll, genauer definiert werden kann. Geht es beispielsweise um das Auslesen von Datumsangaben, kann explizit ein Datumsformat (Bsp. "01/01/0123") hinterlegt werden.