Viele Branchen sehen sich mit zunehmenden Compliance-Anforderungen, der Nachfrage der Verbraucher nach detaillierten Verpackungsinformationen auf Losebene und dem Wettbewerbsdruck in Bezug auf Geschwindigkeit und Effizienz der Lieferkette konfrontiert. Angesichts strenger Vorschriften zur Rückverfolgbarkeit und zum Schutz vor Fälschungen hat die Pharmaindustrie eine Vorreiterrolle bei der Nutzung der optischen Zeichenerkennung (Optical Character Recognition, OCR) zur Gewährleistung der Sicherheit über die gesamte Lieferkette hinweg übernommen. Dies erforderte erhebliche Investitionen, den Aufbau von Fachwissen und einen langen Lernprozess.
Angesichts unterschiedlicher Schriftarten und Trägermaterialien, sowie der komplexen visuellen Umgebung von Fertigungs- und Logistiklinien war die Automatisierung von OCR-Applikationen schon immer eine Herausforderung, die nur mit geschulten Automatisierungsingenieuren, hohem Zeiteinsatz und einem beträchtlichen finanziellen Engagement zu lösen war. Selbst bei bester Leistung konnten herkömmliche OCR-Systeme in puncto Genauigkeit allerdings nie annähernd 100 Prozent erreichen, was manuelle Eingriffe erforderte und den Durchsatz einschränkte. Die Anforderungen an Geschwindigkeit und Genauigkeit von Hochgeschwindigkeits-Lieferketten zeigen nun die Grenzen der herkömmlichen OCR auf. Edge Learning, eine benutzerfreundliche Form der KI, bietet hingegen eine schnelle und zuverlässige Möglichkeit zur Automatisierung von Lieferketten mit OCR.
Anwendungsfälle und Herausforderungen
OCR kommt bereits seit langer Zeit in verschiedensten Anwendungen zum Einsatz. Dabei haben sich vier wesentliche Einsatzfelder herauskristallisiert:
Das Auffinden und Verifizieren alphanumerischer Zeichen
Die Umwandlung von Codes in eine digitale Form, mit der sich jedes Teil oder Produkt in der Lieferkette verfolgen lässt
Die Bestätigung, dass der gedruckte Code mit dem Teil oder Produkt und dem Barcode übereinstimmt
Die Überprüfung, ob der entsprechende Code korrekt gedruckt wurde
Trotz aller Praxistauglichkeit bringen herkömmliche OCR-Systeme gewisse Herausforderungen bei ihrer Nutzung mit sich. So erfordern sie eine präzise Beleuchtung und müssen mit unterschiedlich reflektierenden Materialien, einer großen Designvarianz von Verpackungen sowie mit teilweise unsauberen Drucken zurechtkommen. Wird auch nur eine dieser Bedingungen nicht richtig erfüllt, so erhöht sich die Fehlerquote.
Edge Learning hat das Thema OCR verändert, indem es sowohl die Geschwindigkeit als auch die Genauigkeit verbessert und eine einfachere Anwendung in einer größeren Anzahl von Branchen und Situationen ermöglicht.
Intelligentere KI für einfachere OCR
Mit Hilfe von Edge Learning können hochentwickelte KI-Algorithmen auf die spezifischen Anforderungen von Hochgeschwindigkeits-Lieferketten ausgerichtet werden, so dass OCR schnell und präzise ist, einfach eingesetzt und schnell trainiert werden kann.
Herkömmliche regelbasierte OCR kann unter idealen Bedingungen eine Genauigkeitsrate von bis zu 98 Prozent erreichen. Bei den Mengen, die in modernen Lieferketten gehandhabt werden, führt diese Rate immer noch zu vielen Ausschussteilen, was den Gesamtdurchsatz verringert.
Vortrainierte Edge-Learning-Algorithmen übertreffen diese Genauigkeitsrate, denn sie sind auf die Herausforderungen beim Lesen von Text unter den Bedingungen von Fertigungs-, Prüf- und Logistiklinien zugeschnitten, die mit hoher Geschwindigkeit arbeiten. Die Edge-Learning-Verarbeitung wird dabei auf dem Gerät selbst durchgeführt, direkt an der Fertigungs- beziehungsweise Logistiklinie, ohne dass eine Kommunikation mit einem anderen Prozessor erforderlich ist. Dies führt zu Geschwindigkeitsvorteilen gegenüber herkömmlichen OCR-Systemen.
Komplexere KI-gestützte Deep-Learning-Algorithmen sind ebenfalls in der Lage, OCR durchzuführen. Sie erreichen unter passenden Bedingungen eine Genauigkeit von nahezu 100 Prozent und können jede Art von Text lesen lernen. Ihr Nachteil: Sie sind zu langsam für den unmittelbaren Einsatz an Fertigungs- beziehungsweise Logistiklinien, erfordern hochentwickelte Prozessoren sowie umfangreiches Fachwissen bei der Implementierung. Für die jeweilige Anwendung vorab trainierte Edge-Learning-Tools erreichen aufgrund ihrer Spezifität die Genauigkeit von generalisierten Deep Learning-Systemen und sind dabei in der Lage, die von der Industrie geforderten Geschwindigkeiten zu erzielen.
Die herausragende Geschwindigkeit und Genauigkeit von Edge-Learning-Tools wird dabei im Idealfall durch eine hochentwickelte Hardware wie dem Bildverarbeitungssystem In-Sight 3800 von Cognex gewährleistet. Diese Smart-Kamera verfügt über einen leistungsstarken Sensor, eine integrierte Beleuchtung, ein Autofokus-Flüssiglinsen-Objektiv für eine schnelle Fokussierung und hohe Geschwindigkeiten sowie einen integrierten Prozessor. Ihre HDR+-Funktion ermöglicht verkürzte Belichtungszeiten, wodurch sich Anwendungen mit schnelleren Liniengeschwindigkeiten realisieren lassen. Das kleine Gehäuse des In-Sight 3800 ist unempfindlich gegen Vibrationen. In-Sight 3800 ist einfach zu platzieren, mit Strom zu versorgen und mit einer Fertigungs- beziehungsweise Logistiklinie zu verbinden, um Bilder zu erzeugen, die gut für die Edge-Learning-OCR geeignet sind.
Trainingsaufwand reduziert
Herkömmliche regelbasierte OCR-Bildverarbeitungssysteme haben einen hohen Programmieraufwand bei der Einrichtung. Sie erfordern Zeit, Fachwissen und eine Neuprogrammierung, wenn sich die Anforderungen ändern.
Im Gegensatz dazu werden Deep Learning-basierte Systeme trainiert, indem man ihnen spezifische, mit Tags versehene Bilder der entscheidenden Merkmale vorlegt. Deep Learning kann erstaunliche Fähigkeiten entwickeln, um feine Unterscheidungen zu treffen und Texte unter einer Vielzahl von schwierigen Bedingungen exakt zu lesen. Um diese Genauigkeit zu erreichen, können jedoch Hunderte oder sogar Tausende von markierten Bildern für das Training erforderlich sein.
Für die vortrainierte Edge-Learning-OCR reicht dagegen bereits eine kleine Zahl an Bildern zum spezifischen Anwendungsfall aus, um die Fähigkeit zu entwickeln, die gewünschten Schriften zu lesen. Für dieses spezifische Training der OCR ist zudem kein spezielles Wissen über Bildverarbeitung oder KI-Algorithmen erforderlich, sondern lediglich die Kenntnis der erforderlichen OCR-Aufgabe.
Einfache Implementierung
Auch in Bezug auf die Implementierung bieten Edge Learning-basierende OCR-Systeme Vorteile im Vergleich zu regelbasierten oder Deep-Learning-Bildverarbeitungssystemen. So sind damit weder unterschiedliche Schriftenbibliotheken noch detaillierte Analysen der möglichen Fehllesung verschiedener Symbole nötig.
Herkömmliche OCR-Programme verwenden eine Reihe spezifischer Techniken, um die Gefahr der Fehllesung eines Symbols zu verringern, zum Beispiel spezielle Schriftenbibliotheken oder eine Feldeinteilung, die eine sorgfältige Definition jeder möglichen Stelle in einem Code und die Festlegung des Typs erfordert, so dass zum Beispiel die Ziffer „8“ in einem definierten numerischen Feld nicht fälschlicherweise als ein „B“ gelesen werden kann.
Wenn die Edge-Learning-OCR einen Fehler macht, lernt sie durch eine einfache Korrektur durch den Bediener, ähnliche Fehler in Zukunft zu vermeiden. Sie lernt von selbst, welche Merkmale für Genauigkeit sorgen, ohne spezielle Programmierung, Feldeinteilung oder andere zeitaufwendige Verfahren.
KI-Optionen integriert
Mit seinem Bildverarbeitungssystem In-Sight 3800 bietet Cognex Anwendern eine leistungsfähige Option für die Realisierung schneller, präziser Prüfanwendungen auf Basis von Künstlicher Intelligenz an. Das für Hochgeschwindigkeits-Produktionslinien konzipierte System stellt ein umfangreiches Vision-Toolset, leistungsstarke Bildverarbeitungsfunktionen und eine flexible Software zur Verfügung, um vollständig integrierte Lösungen für eine breite Palette von Prüfanwendungen zu liefern. Ein wesentliches Element des In-Sight 3800 ist der umfangreiche Satz an Bildverarbeitungswerkzeugen, die sowohl die auf KI-basierende Edge-Learning-Technologie als auch traditionelle regelbasierte Algorithmen umfassen.
Mit Hilfe von In-Sight 3800 lassen sich somit zahlreiche Anwendungen zum Lesen von Klarschrift und zur Fehlererkennung an Codes in unterschiedlichsten Branchen wie unter anderem in den Bereichen Automotive, Lebensmittelproduktion, Logistik und vielen weiteren schnell und zuverlässig realisieren. Auf diese Weise steht Anwendern eine effiziente Möglichkeit zur Verfügung, die Rückverfolgbarkeit von Produkten entlang der Lieferketten mit OCR zu maximieren.