Da neuronale Netze immer tiefer und komplexer werden, steigen die Anforderungen an die Rechenleistung rasant. Inzwischen ändern sich die Architekturen von neuronalen Netzen stetig: Es kommen nicht nur neue Netzwerke hinzu, sondern auch Märkte und Anwendungen. Diese Trends erfordern eine leistungsfähige und universelle neuronale Netzwerk-Verarbeitungslösung für Embedded Systeme, die nicht nur wenig Energie verbraucht, sondern auch flexibel programmierbar ist.
Doppelt hält nicht immer besser
Bildverarbeitungssysteme in Autos, Drohnen und Sicherheitssystemen benötigen zwei grundsätzliche Arten von Bildverarbeitung.
Zuerst wird das von der Kamera aufgenommene Bild mit konventionellen Foto-/Bildverarbeitungsalgorithmen verbessert. Zweitens führen auf neuronalen Netzen basierende Algorithmen eine Erfassung und Erkennung von Objekten durch.
Bestehende Neural Network Accelerator Lösungen sind Hardware-Beschleuniger, die an Bildverarbeitungs-DSPs angekoppelt sind, wobei der Code des neuronalen Netzes zwischen der Ausführung einiger Netzwerkschichten auf dem DSP und der Verlagerung von Faltungsebenen auf den Beschleuniger aufgeteilt wird. Diese Kombination ist ineffizient und verbraucht unnötige Leistung.
Turbo für die Bildverarbeitung
Der speziell für neuronale Netze ausgelegte Vision C5 DSP von Cadence beschleunigt die Berechnungen auf allen Schichten des neuronalen Netzes (Faltung, vollständig verknüpft, Pooling und Normalisierung) und nicht nur der Faltungsfunktionen. Dadurch wird der Vision/Bildverarbeitungs-DSP von einigen Aufgaben befreit und kann die Bilderverbesserungsanwendungen unabhängig ausführen, während der Vision C5 DSP die Inferenzaufgaben abarbeitet.
Durch die Vermeidung von unnötigem Datenaustausch zwischen dem neuronalen Netz DSP und dem Vision/Bildverarbeitungs-DSP ermöglicht der Vision C5 DSP eine Lösung mit geringerem Energieverbrauch als ein vergleichbarer Neural Network Accelerator. Zudem bietet er auch ein einfaches Ein-Prozessor-Programmiermodell für neuronale Netze.
Flexibel beschleunigen
Der Vision C5 DSP ist laut Entwickler Cadence eine flexible Lösung, die variable Kernel-Größen, sowie Tiefen- und Eingangs-Dimensionen unterstützt. Der DSP beinhaltet verschiedene Koeffizienten-Komprimierungs/Dekomprimierungsverfahren und bietet eine Unterstützung für neue Ebenen, die hinzugefügt werden können, sobald sie verfügbar sind.
Der Vision C5 DSP wird auch mit dem Neural Network Mapper Toolset von Cadence geliefert, dass jedes neuronale Netz, das mit Tools wie Caffe und TensorFlow trainiert wurde, auf einen ausführbaren Code für den Vision C5 DSP abbildet, unter Ausnutzung eines umfangreichen Satzes Neurale-Netzwerk-Bibliothek-Funktionen.