Ensenso XR Onboard-Processing

Komplettpaket macht die Technologie anwendertauglich

Deep Learning eröffnet der industriellen Bildverarbeitung neue Einsatzgebiete, die zuvor nur mit viel Aufwand oder gar nicht lösbar waren. Der neue, zur klassischen Bildverarbeitung, grundlegend unterschiedliche Ansatz bringt für die Anwender neue Herausforderungen mit sich – ein Umdenken ist notwendig. IDS präsentiert deshalb ein Embedded Vision Komplettpaket, mit der jeder Anwender in wenigen Schritten und ohne Programmierkenntnisse KI-basierte Bildverarbeitung realisieren und auf einer Kamera – als eingebettetes Inferenzsystem – einsetzen kann. Deep Learning wird damit anwendertauglich.

Computer Vision und Bildverarbeitung sind zu unabdingbaren Werkzeugen in unterschiedlichen Bereichen geworden. Die bildverarbeitenden Systeme bekommen es mehr und mehr mit stetig wachsender Produkt- und Variantenvielfalt und organischen Objekten wie Obst, Gemüse oder Pflanzen zu tun. Konventionelle Ansätze mit regelbasierter Bildverarbeitung stoßen schnell an ihre Grenzen, wenn die zu analysierenden Bilddaten zu häufig variieren und die Unterschiede nicht oder nur schwierig durch Algorithmen abzubilden sind. Eine robuste Automatisierung ist in solchen Fällen durch ein unflexibles Regelwerk nicht realisierbar. Auch wenn es sich dabei um eine für Menschen vermeintlich einfach zu lösende Aufgabe handelt. Als Beispiel, ein Kind ist in der Lage ein Auto als solches zu erkennen, auch wenn es ein spezielles Modell noch nie vorher gesehen hat. Dazu reicht es aus, wenn das Kind genügend andere Automodelle vorher gesehen hat.

Die Fähigkeit, flexibel und selbstständig zu entscheiden, ist durch maschinelles Lernen heute auch auf Bildverarbeitungssysteme übertragbar. Mithilfe neuronaler Netze und Deep Learning Algorithmen können wir einem Computer beibringen, Objekte zu sehen, wieder zu erkennen und aus dem Gelernten Schlussfolgerungen zu ziehen. Wie ein Mensch, lernt und entscheidet eine solche "intelligente Automatisierung" anhand von Erfahrungswerten.

Unterschiede zur klassischen Bildverarbeitung

Der wesentliche Unterschied zur regelbasierten Bildverarbeitung (BV) liegt in der Art und Weise wie und von wem Bildmerkmale identifiziert werden und wie das erlernte Wissen repräsentiert wird. Beim klassischen bzw. "symbolischen Ansatz" liegt es in der Hand eines Bildverarbeitungsspezialisten, die für Ihn ausschlaggebenden Bildmerkmale zu selektieren und bestimmten Regeln folgend zu beschreiben. Viele Zeilen Quellcode sind erforderlich, um detailliert festzulegen, wie eine gegebene Aufgabe zu lösen ist. Denn nur das, was die Regeln abdecken, kann die Software erkennen. Die spätere Ausführung erfolgt in festgelegten Grenzen ohne Interpretationsspielraum. Die eigentliche geistige Leistung liegt also allein beim BV-Experten.

Ganz anders ist das Vorgehen bei der Arbeit mit neuronalen Netzen. Deren Vorteil liegt genau darin, selbständig zu "lernen", welche Bildmerkmale wichtig sind, um daraus die richtigen Schlussfolgerung zu treffen. Wir sprechen dann vom "nicht-symbolischen Ansatz", da das Wissen nur implizit vorliegt und keinen Einblick in die erlernten Lösungswege zulässt. Welche Merkmale gespeichert, wie sie gewichtet und welche Schlussfolgerungen getroffen werden, beeinflussen lediglich die Menge und die Inhalte der Trainingsbilder. Deep Learning Algorithmen erkennen und analysieren die vollständigen Bildinhalte und setzen erkannte Merkmale je nach Häufigkeit des Auftretens in Beziehung mit den zu lernenden "Begriffen". Die statistische Häufigkeit erzeugt beim Training das, was wir Erfahrung nennen. Googles Spezialistin für Künstliche Intelligenz Cassie Kozyrkov bezeichnet Machine Learning auf dem diesjährigen WebSummit 2019 in Lissabon als Werkzeug zum Programmieren. Es erlaube einer Maschine, Dinge über Beispiele beizubringen, anstatt über viele Instruktionen.

Für die Entwicklung von Machine Vision Anwendungen auf KI-Basis ist demnach ein Umdenken erforderlich. Es ist wichtig zu verstehen, dass die Qualität der Ergebnisse – sprich die Geschwindigkeit und Zuverlässigkeit in der Erkennung von Objekten – davon abhängt, was ein neuronales Netz  erkennt und daraus schlussfolgert. Hier spielt das Wissen des entsprechenden Facharbeiters eine ganz entscheidende Rolle, der die geeigneten Datensätze für das Training mit möglichst vielen unterschiedlichen Beispielbildern mitsamt den zu lernenden Begriffen bereitstellen muss. Die Verantwortung, die beim klassischen Ansatz bei einem Bildverarbeitungsspezialisten lag, übernimmt beim Machine Learning ein Datenspezialist.

Sofort Loslegen mit dem Machine Learning Kompletttpaket

IDS möchte den Anwender schon bei den ersten Schritten mit der neuen Technologie unterstützen. Mit einem Inferenzkamera-Komplettpaket kombiniert IDS Deep Learning Erfahrung und Kameratechnik. Jedem Anwender wird damit der Soforteinstieg in die KI-basierte Bildverarbeitung ermöglicht. Mit IDS NXT Experience Kit ebnet IDS die Einstiegshürde und stellt einfach nutzbare Werkzeuge bereit, mit denen ohne viel Vorwissen Inferenzaufgaben in wenigen Minuten erstellt und sofort auf einer Kamera ausgeführt werden können.

Das Konzept basiert auf drei wichtigen Komponenten:

  • Einer einfach bedienbaren Trainingssoftware für neuronale Netze
  • und einer intelligenten Kameraplattform
  • inklusive eines KI-Beschleunigers, der die neuronalen Netze hardwareseitig ausführt.


Alle Komponenten sind von IDS selbst entwickelt und optimal aufeinander abgestimmt. Das macht es für den Anwender besonders einfach und das Gesamtsystem sehr leistungsfähig.

Die cloud-basierte Trainigssoftware IDS lighthouse führt Schritt für Schritt durch die Datenvorbereitung bis zum Training der künstlichen Intelligenz in Form eines neuronalen Netzes. Der Anwender kommt dabei niemals in Kontakt mit irgendwelchen Basiswerkzeugen oder muss sich mit der Installation von Entwicklungsumgebungen auseinandersetzen. Als Webanwendung ist IDS lighthouse sofort einsatzbereit. Dem Anwender stehen für all seine Projekte genügend Speicherplatz und ausrechend Trainings-Performance in einem einfach bedienbaren Workflow zur Verfügung. Einloggen, Trainingsbilder hochladen, labeln und anschließend das gewünschte Netz trainieren.

Mit wenigen Konfigurationseinstellungen spezifiziert der Anwender in einfachen Dialogen die Anforderungen für Geschwindigkeit und Genauigkeit an seine Anwendung. Netzauswahl und Einrichtung der notwendigen Trainingsparameter nimmt IDS lighthouse daraufhin völlig selbständig vor. Die Trainingsergebnisse vermitteln dem Anwender bereits eine gute Vorhersage über die Qualität der trainierten Intelligenz und ermöglichen so ein schnelles Ändern und Wiederholen des Trainingsprozesses. Das System wird kontinuierlich verbessert und ausgebaut. Ohne Update und Wartungsphasen einplanen zu müssen, steht Jedem immer die aktuellste Version der Software zur Verfügung. Der Anwender kann sich somit vollständig auf die Lösung seiner Anwendung konzentrieren, ohne das Wissen über Lernmethoden und künstliche Intelligenz selbst aufbauen zu müssen.

Der Hersteller setzt bei IDS lighthouse auf das "überwachte Lernen" (Supervised Learning), um neuronale Netze zu trainieren. Die Deep Learning-Algorithmen lernen mit vorgegebenen Paaren von Ein- und Ausgaben. Dazu stellt der Lehrer – in dem Fall der Anwender – während des Lernens den korrekten Funktionswert zu einer Eingabe bereit, indem er einem Bildbeispiel die korrekte Klasse zuordnet. Dem Netz wird die Fähigkeit antrainiert, Assoziationen selbstständig herzustellen, indem es Vorhersagen zu Bilddaten in Form von Prozentwerten macht. Je höher der Wert, desto genauer und sicherer ist die Vorhersage.

Für einen schnellen Erfolg sorgt das nahtlose Zusammenspiel der Software mit den IDS NXT Kamerafamilien rio & rome. Denn fertig trainierte neuronale Netze können direkt und ohne Programmieraufwand auf einer dieser Kameras hochgeladen und ausgeführt werden. Damit hat der Anwender sofort ein funktionierendes vollständiges Embedded Vision System, das eigenständig sieht, erkennt und Ergebnisse zu den aufgenommenen Bilddaten ableitet. Mit seinen digitalen Schnittstellen können sogar Maschinen direkt angesteuert werden.

Embedded Vision Hybrid-System

IDS hat für den FPGA der intelligenten IDS NXT Kameraplattform einen eigenen KI-Core, namens "deep ocean core" entwickelt, der vortrainierte neuronale Netze hardwarebeschleunigt ausführt. Das macht die vollwertigen Industriekameras zu leistungsstarken Inferenzkameras, die künstliche Intelligenz im industriellen Umfeld sinnvoll nutzbar machen. Bildanalysen finden dezentral statt, wodurch sich Bandbreiten-Engpässe in der Übertragung vermeiden lassen. IDS NXT Kameras können, was Genauigkeit und Geschwindigkeit von KI-Aufgaben angeht, mit modernen Desktop CPUs Schritt halten – bei gleichzeitig wesentlich geringerem Platz- und Energieverbrauch. Durch die Wiederprogrammierbarkeit des FPGAs ergeben sich zusätzlich Vorteile wie Zukunftssicherheit, geringe wiederkehrende Kosten und Time-to-Market.

Durch die perfekte Abstimmung der IDS-eigenen Software und Hardware, kann der Anwender die maximale Inferenzzeit zudem selbst vor dem Training bestimmen. IDS lighthouse kümmert sich daraufhin, um optimale Trainingseinstellungen unter Berücksichtigung der KI-Core-Performance der Kamera. Damit erwarten den Anwender bei der späteren Ausführung der Inferenz keine Überraschungen, wodurch zeitraubendes Nachjustieren und Nachtrainieren entfällt. Das IDS NXT System bleibt damit außerdem für den Anwender, einmal integriert, immer 100% kompatibel und konsistent in seinem Verhalten. Gerade bei industriell zertifizierten Anwendung ist das ein klarer Vorteil.

Durch die leistungsfähige Hardware ist die Embedded Vision Plattform aber weit mehr als eine reine Inferenzkamera für die Ausführung von neuronalen Netzen. Der Funktionsumfang der CPU-FPGA Kombination wird im nächsten Entwicklungsschritt mittels Vision Apps vom Anwender ganz nach Bedarf erweiterbar werden. Wiederkehrende Vision-Aufgaben lassen sich dann schnell einrichten und wechseln. Auch ein vollständig flexibel agierender Bildverarbeitungsablauf ist dann realisierbar. Aufgenommene Bilder durchlaufen beispielsweise zuerst eine Vorverarbeitung, bevor eine recht simple und schnelle Klassifizierung Gut und Schlecht-Teile sortiert. Bei Auftreten von Fehlern kann in Millisekunden ein weitaus komplexeres neuronales Netz nachgeladen werden, um die Fehlerklasse viel detaillierter zu bestimmen und die Ergebnisse an eine Datenbank übermitteln. Per App-Entwicklungskit werden maßgeschneiderte Lösungen einfach realisierbar. Anwender können dann individuelle Vision Apps in wenigen Schritten selbst erstellen und auf IDS NXT-Kameras installieren und ausführen.

IDS NXT Kameras sind konzipiert als Hybridsysteme, um sowohl Vorverarbeitung von Bilddaten mit klassischer Bildverarbeitung als auch eine Merkmalsextraktion mittels neuronaler Netze nebeneinander einzusetzen, um Bildverarbeitungsanwendungen effizient auf einem Gerät zu nutzen.

Fazit

Mit IDS NXT Experience Kit wird Deep Learning für alle sinnvoll und anwenderfreundlich nutzbar. IDS stellt eine Hardware-Software-Kombination vor, die optimal aufeinander abgestimmt ist. Intelligente Erkennungsvorgänge und Automatisierung in vielen (neuen) Anwendungsgebieten werden enorm vereinfacht oder sogar erstmalig möglich. In wenigen Schritten und ohne Programmierkenntnisse lassen sich damit KI-basierte Bildverarbeitungslösungen erstellen und ausführen. Mit der Trainingssoftware IDS lighthouse ist der Hersteller bewusst in die Cloud gegangen, um Speicherplatz und Trainingsperformance auf die Anforderungen der Anwender skalieren zu können. Zudem müssen keine Update- und Wartungsphasen eingeplant werden, um von kontinuierlichen Verbesserungen zu profitieren. So steht jedem Anwender immer die aktuellste Version der Software zur Verfügung. Für den Einstieg in die KI-basierte Bildverarbeitung bietet der Hersteller außerdem ein Inferenz-Starter-Paket mit allen benötigten Komponenten an. Von der Kamera mit Stromversorgung und Objektiv bis zur Trainingslizenz für IDS lighthouse ist alles dabei um sofort loszulegen. Think Inferent!