Press PLAY to OCR

Nicht KI, sondern wie man KI einsetzt, macht den Unterschied

Die optische Zeichenerkennung, kurz OCR (Optical Character Recognition), zählt auch heute noch zu einer der schwierigsten Disziplinen in der Bildverarbeitung und maschinellen Intelligenz. Schon die reine Vielfallt an möglichen Schriftzeichen und Verfahren, wie diese auf verschiedensten Oberflächen angebracht werden, vermittelt eine Vorstellung der Herausforderungen.

Und die Erwartungen an eine OCR sind hoch. Heutzutage gehen Anwender davon aus, dass sie alle Zeichen out-of-the-box erkennt und richtig deutet, ähnlich wie ein Mensch es kann. Daher sind auf Deep-Learning basierende OCR-Systeme auf dem Vormarsch. Ihr Vorteil: Durch variantenreiches Training mit realen und synthetischen Beispieldaten erlernen sie den notwendigen Interpretationsspielraum, der den regelbasierten Ansätzen fehlt.