KI - Spielwiese oder Industriewerkzeug?

Das ist eine Frage, die momentan häufig diskutiert wird. Die Antwort dazu liegt wie so oft im Auge des Betrachters. Denn jeder Anwender hat andere Erwartungen an das was eine Technologie leisten oder mitbringen muss, um anerkannt und letztendlich eingesetzt zu werden. Die notwendige Hardware für den produktiven und effizienten Einsatz steht jedenfalls zur Verfügung. Viele Hersteller von Machine Vision Hardware haben das erkannt. Das Angebot von KI-Plattformen unterschiedlicher Leistungsklassen wächst daher stetig an. Aber es gibt dennoch Startschwierigkeiten. Die übliche Bereitstellung von Hardware allein reicht nicht – ein Umdenken ist notwendig!

Was fehlt der KI?

Wenig hilfreich ist, dass KI bzw. Machine Learning (ML) ganz anders funktioniert als regelbasierte Bildverarbeitung und sich damit auch die Herangehensweise und Bearbeitung von Vision Aufgaben unterscheidet. Die Qualität der Ergebnisse ist auch nicht mehr das Produkt von manuell entwickeltem Programmcode, sondern wird durch den Lernprozess mit geeigneten Bilddaten bestimmt. Was so einfach klingt, führt nur mit ausreichend Fachwissen und Erfahrung zum gewünschten Ziel. Ohne geschultes Auge für die richtigen Daten treten oft Fehler auf, die wiederum zu einer falschen Anwendung von ML-Methoden führen. Tests haben gezeigt, dass unterschiedliche Nutzer für die selbe Aufgabe sehr unterschiedliche Trainings-Qualitäten der künstlichen neuronalen Netze (KNN) erzielen, weil teilweise Bilder mit zu viel unwichtigem Inhalt, schlechter Belichtung, Unschärfe oder auch falschen Labels für das Training verwendet wurden.

Die Schlüsselkompetenzen für die Arbeit mit ML-Methoden sind nicht mehr dieselben wie bei der regelbasierten Bildverarbeitung und müssen daher gezielt aufgebaut werden. Wer jetzt die Zeit und Ressourcen hat, damit zu arbeiten, zu testen und zu spielen, sammelt diese Erfahrung und kennt die Fallstricke. Deshalb arbeiten derzeit wohl eher neue und junge Firmen damit. Sie haben keine Altlasten, sind nicht an bestehende Verfahren gebunden und wagen sich dabei teilweise spielerisch und mit viel Forscherdrang an Aufgaben, wo die klassische Bildverarbeitung bisher ohne Lösung blieb. Doch solange die Big-Player die neue Technologie noch nicht flächendeckend beim Kunden einführen und sich dafür stark machen, fehlt das Wissen und das Vertrauen – auch beim Kunde. Um die "alten Hasen" aus ihrer Komfortzone zu locken, muss sich etwas ändern. Denn die KI steht einem etablierten System gegenüber, wofür in den vergangenen Jahren passende Umgebungsbedingungen geschaffen wurden. Wissen, Dokumentation, Trainings, Hardware, Software, Entwicklungsumgebungen, Akzeptanz und Nachfrage seitens der Kunden hatten lange Zeit zu reifen. KI kommt dagegen noch sehr roh und puristisch daher. Wer sie beherrscht erntet zwar Bewunderung und Anerkennung - aber auch fragende Gesichter und Unverständnis.

Ein weiterer wichtiger Aspekt für die Zukunft sind neue Zielgruppen. Dr.-Ing Peter Ebert, Chefredakteur der Fachzeitschift inVISION und Kenner der Szene meint: "Die Vision-Community der Zukunft besteht nicht nur aus klassischen Bildverarbeitungsexperten, sondern bekommt auch Zuwachs aus dem IoT-Bereich." Mit neuen Anwendergruppen ergeben sich zwangsläufig andere Use Cases und Anforderungen für die Nutzung vorhandener Technologien. Nicht immer reicht das klassische Programmier-SDK aus. Altbewährte Regeln müssen aufgebrochen werden!

Software als Wegbereiter

Es fehlt nicht an passender Hardware! Die Einsatzmöglichkeiten von ML werden durch effizient arbeitende KI-Beschleuniger vor allem sehr interessant für kleine stromsparend arbeitende Embedded Vision Systeme bzw. vollintegrierte Inferenzkamera Plattformen, wie sie bereits von einzelnen Herstellern angeboten werden. Doch die Startschwierigkeiten der neuen Technologie in der Industrie löst das allein nicht. Die KI muss getestet, validiert, nachtrainiert und abschließend in einen produktiv arbeitenden Workflow – die Anwendung integriert werden. Aber wer macht das? Wer kann das? All das sind eigentlich immer die selben wiederkehrenden Aufgaben. Doch dafür sind andere Kompetenzen notwendig, die über die Prototypenentwicklung hinausgehen. Dazu braucht es meist noch einen Systemprogrammierer, der in der Lage ist, diese Werkzeuge für eine spezielle Plattform zu programmieren.

IDS geht mit der IDS NXT Plattform einen anderen Weg und ist sich sicher: Mit den richtigen, aufeinander abgestimmten Werkzeugen kann jede Benutzergruppe das Potential einer AI-Vision-Plattform voll nutzen, ohne viel Zeit und Kosten in den Aufbau neuer Kernkompetenzen zu stecken, die für die Umsetzung eigener KI-Anwendungen eigentlich gar nicht zwingend benötigt werden. Was bedeutet das? Spezialwissen für das Trainieren neuronaler Netze und das Programmieren eigener Anwendungen lassen sich für viele einfache KI-Workflows in den Werkzeugen verpacken. So kann jeder Benutzer seine individuellen Anforderungen umsetzen, ohne ein eigenes Spezialistenteam aufzubauen. Die Software ermöglicht dabei, dass jede Benutzergruppe, die für ihre jeweiligen Aufgaben und Arbeitsweisen passenden Werkzeuge verwenden kann.

Eine Bildverarbeitungsanwendung ist der Rahmen, der mehrere spezifische Einzelaufgaben in einen anwendungsspezifischen Ablauf bringt und fehlerfrei und effizient ausführen soll. Klassisch wird diese Aufgabe von Entwicklern in einem zur Plattform passenden Programmcode wie z.B. C++ programmiert. Wenig anders verhält es sich bei den neu auf den Markt kommenden KI-Plattformen. Ein SDK (Software Development Kit) stellt die notwendigen Softwareschnittstellen zur hardwarenahen Programmierung der jeweiligen Plattform mitsamt der vorhandenen KI-Beschleuniger bereit. Meist steht den Anwendungsentwicklern damit eine weitgehend frei programmierbare Plattform für eigene Prozesslösungen zur Verfügung. Für denjenigen, der weiß was er tut, stellen lediglich die Hardwareperformance und die SDKs eine Grenze für die Kreativität dar. Auch die IDS NXT Inferenzkamera ist durch ein entsprechendes SDK mit vielen C++ Sourcecode-Beispielen eine offene Plattform für Entwickler, die vollständig eigene Bildverarbeitungsanwendungen in Form von Vision Apps mit dem KI-Beschleuniger deep ocean entwerfen wollen.

Anwendungs-Assistent

Ein Großteil der Bildverarbeitungsanwendungen arbeiten jedoch mit relativ einfachen Abläufen. Bild aufnehmen → Bild analysieren bzw. Merkmale extrahieren (Bildverarbeitung) → Prozessentscheidungen treffen → Aktion einleiten. Das kann einfaches Erkennen und Klassifizieren von Produkten sein, mit anschließender Signalisierung oder Weiterleitung von Informationen über verschiedene Schnittstellen für eine Maschinensteuerung oder Sortieranlage. Das sind Basisfunktionalitäten, die sich lediglich in wenigen Details unterscheiden und deshalb nicht jedes mal neu programmiert werden müssten. Doch die Auswahl eines Deep Learning (DL) Use Cases, wie "Klassifikation" oder "Objekt Detektion" sind als Einstiegspunkt für ein Projekt oft bereits zu abstrakt, um die weiteren notwendigen Handlungsschritte für die Datenaufnahme und Vision App Konfiguration ableiten zu können.

IDS geht deshalb den Weg, die AI-Vision mit IDS NXT Inferenzkameras für die breite Masse zugänglich und einfach bedienbar zu machen. Die App-Erstellung soll für jede Anwendergruppen möglich sein, egal ob Programmierer, Bildverarbeitungsprofi oder Maschinenbediener und Facharbeiter. Zu diesem Zweck wird die cloudbasierte KNN-Trainingssoftware IDS lighthouse mit dem nächsten Update um einen Assistenten erweitert, der sich noch stärker an der eigentlichen Problemstellung des Anwenders orientiert und ihn mit entsprechenden Handlungsanweisungen unterstützt. Der Wizard erweitert auf einfache Weise den Aktionsradius der Zielgruppe und begleitet nun alle Einzelaufgaben einer Machine Vision Anwendung. Angefangen mit der Frage "Was wollen Sie tun" stellt IDS lighthouse sehr anwendungsnahe Problemstellungen zur Auswahl, wie beispielsweise "Objekte zählen", "An- oder Abwesenheit prüfen" oder "Prüfstellen kontrollieren". Der Assistent wählt damit im Hintergrund die App-Basis mit dem passenden DL Use Case und schlägt dem Anwender die weiteren Handlungen vor, um die notwendigen Informationen zusammen zu tragen. Darüber hinaus werden nützliche Hinweise, Videos oder Anleitungen angeboten, um dem Anwender das nötige Hintergrundwissen nahe zu bringen. Eine derartige "geführte Anwendungserstellung" erinnert mehr an ein Tutorial, als an klassische App-Entwicklung. Am Ende steht eine vollständig kundenspezifische Vision App zum Download zur Verfügung, die der Anwender nur noch auf einer IDS NXT Kamera aktivieren und starten muss.

"Puzzeln" statt Programmierung

Wer komplexere Abläufe erstellen möchte, muss nicht zwingend gleich auf C++ oder anderen textbasierte Programmiersprachen zurückgreifen. Verpackt man die Funktionsbibliothek in visuelle Blöcke und spendiert dazu eine visuellen Editor, können Abläufe wie Puzzleteile zusammengesteckt werden, ohne sich Gedanken über die exakten Befehle der einzelnen Programmiersprachen machen zu müssen. Blockly ist ein Projekt von Google, das genau zu diesem Zweck erstellt wurde. IDS greift auf Blockly zurück und adaptiert eigene Funktionalitäten, um Inferenzaufgaben der Kamera in eine Art Baukasten in beliebig komplexen Abläufen zusammenzustecken zu können.

Mit Blockly lassen sich auch mehrstufige Prüfungen mit mehreren KNN sehr einfach in einem Programmablauf zusammenstecken.
Mit Blockly lassen sich auch mehrstufige Prüfungen mit mehreren KNN sehr einfach in einem Programmablauf zusammenstecken.

Durch die intuitiv bedienbare Oberfläche des Blockly Editors erzielen auch Anfänger und Laien schnell Erfolge. Der Vorteil der visuellen Programmierung mit diesem Baukastensystem gegenüber dem Anwendungs-Assistenten ist die Möglichkeit eigene Abläufe zu erstellen. So können Variablen, Parameter und KI-Ergebnisse durch logische Verknüpfungen mit mathematischen Berechnungen und bedingten if/else-Anweisungen bzw. wiederholenden Aktionen mittels Schleifen auf einfache Weise verknüpft werden. Das ermöglicht auch komplexere Workflows mit zweistufiger Prüfung von Objekten und mehreren neuronalen Netzen. Eine Objekterkennung sorgt zum Beispiel für eine grundlegende Vorsortierung von unterschiedlichen Teilen, gefolgt von einer detaillierten Fehleranalyse durch einen zweiten Klassifikator, um Teile noch spezifischer zu kategorisieren. Solche Abläufe sind sonst nur mit dem VAC (Vision App Creator) und Programmierkenntnissen in C++ möglich.

Ein weiterer Vorteil der gepuzzelten Apps ist ihre sehr dynamische Verwendung. Ähnlich wie man es von Python kennt erlaubt die Vision App-Programmierung mit Blockly die Möglichkeit, "Code" direkt auszuführen, da kein aufwendiges Cross-Kompilieren notwendig ist. Eine in IDS lighthouse erstellte Anwendung kann nach ersten Tests in der Kamera einfach interaktiv weiter programmiert werden – direkt in der Kamera! Vision Apps können dort auch direkt entworfen werden. Das macht diesen visuellen App-Editor zum idealen Werkzeug von der Test- und Erprobungsphase bis in den operativen Einsatz.

Vom vollständig automatisierten Anwendungskonfigurator, über einen Vision App Baukasten mit intuitiv bedienbaren visuellen Interface bis zur völlig freien Programmierung mit klassischem SDK bietet IDS NXT für jedes Wissenslevel das passende Hilfsmittel. Das spart Zeit und Kosten bei der Inbetriebnahme und Einrichtung von individuellen Bildverarbeitungsanwendungen mit künstlicher Intelligenz.

Erklärbare Ergebnisse

Trotz der bekannten Vorteile sehender KI und der hohen Genauigkeiten der eingesetzten KNN gestaltet sich eine Diagnose im Fehlerfall oftmals schwierig. Fehlende Einsicht in die Arbeitsweise bzw. unerklärliche Ergebnisse sind die Kehrseite der Medaille, wodurch die Verbreitung der Algorithmen gehemmt wird. In der Öffentlichkeit werden KNN oft fälschlicherweise als Blackbox wahrgenommen, deren Entscheidungen nicht nachvollziehbar sind. "Obwohl DL-Modelle zweifellos komplex sind, sind sie keine Blackboxen. Tatsächlich wäre es zutreffender, sie als Glaskästen zu bezeichnen, denn wir können buchstäblich hineinschauen und sehen, was jede Komponente tut." [Zitat aus "The black box metaphor in machine learning"]. Inferenz-Entscheidungen neuronaler Netze basieren zwar nicht auf klassischen nachvollziehbaren Regeln und die komplexen Wechselwirkungen ihrer künstlichen Neuronen sind für den Menschen vielleicht nicht einfach erfassbar, sind aber dennoch Ergebnisse eines mathematischen Systems und damit reproduzierbar und analysierbar. Es fehlen nur die richtigen Werkzeuge, die uns unterstützen. Genau in diesem Bereich der KI ist noch viel Luft nach oben. Und genau hier zeigt sich, wie gut die verschiedenen KI-Systeme am Markt den Anwender bei seinem Vorhaben unterstützen können.

IDS forscht und arbeitet auf diesem Gebiet zusammen mit Instituten und Universitäten, um genau diese Werkzeuge zu entwickeln. Die IDS NXT Experience Kit Software beinhaltet bereits die Ergebnisse dieser Zusammenarbeit. Eine Visualisierung in Form sogenannter Attention Maps (Heat Maps) ermöglicht kritische Entscheidungen der KI leichter nachzuvollziehen, um letztendlich die Akzeptanz neuronaler Netze im industriellen Umfeld zu erhöhen. Ebenso lassen sich damit eintrainierte Datenverzerrungen, sogenannte Bias, erkennen und vermeiden (siehe Abbildung "Attention Maps"). Auch statistische Analysen mit Hilfe einer sogenannten Confusion Matrix werden in Kürze sowohl in der cloudbasierten Trainingssoftware IDS lighthouse als auch in der IDS NXT Kamera selbst möglich sein, um die Qualität der trainierten KNN leichter bestimmen und verstehen zu können. Mit Hilfe dieser Software-Werkzeuge können Anwender das Verhalten und die Ergebnisse ihrer IDS NXT KI direkter auf Schwächen innerhalb des Trainingsdatensatzes zurückführen und diese gezielt ausbessern. So wird die KI für jeden erklär- und nachvollziehbar.

Als Komplettpaket industrietauglich

Das enorme Potential der Künstlichen Intelligenz steht außer Frage. Verfügbare Hardware in Form von Inferenzkameras mit KI-Beschleunigern zeigen zudem, wie effizient sie sich bereits einsetzen lässt. Doch die Bereitstellung von Hardware alleine reicht nicht aus, die Industrie flächendeckend mit der KI zu infizieren. Die Hersteller sind gefordert, Anwender zu unterstützen, indem sie ihre Kompetenzen in Form von benutzerfreundlicher Software und integrierten Prozessen weitergeben. Verglichen mit den bewährten Verfahren, die über Jahre gereift sind und sich mit viel Dokumentation, Wissenstransfer und vielen Software-Werkzeugen einen treuen Kundestamm aufgebaut hat, gibt es für die KI noch viel Nachholbedarf, ist aber schon im Aufbau. Auch an Standards und Zertifizierungen wird aktuell gearbeitet, um die Akzeptanz und Erklärbarkeit weiter zu steigern und die KI an den großen Tisch zu holen. Letztendlich sollte sich jeder mit der neuen Technologie vertraut machen, um den Anschluss nicht zu verpassen. IDS hilft dabei. Mit IDS NXT Experience Kit ist bereits ein Embedded KI-System verfügbar, das mit viel nutzerfreundlichen Software-Werkzeugen von jeder Anwendergruppe schnell und einfach als Industriewerkzeug bedient und nutzenbringend eingesetzt werden kann – auch ohne tiefgehende Kenntnisse in Machine Learning, Bildverarbeitung oder Anwendungsprogrammierung.