„Mit unserer photonischen Chiptechnologie, die jetzt über die Standard-PCIe-Schnittstelle verfügbar ist, bringen wir die unglaubliche Leistungsfähigkeit der Photonik direkt in reale Anwendungen. Wir machen damit ein deutliches Statement: Leistung und Nachhaltigkeit können Hand in Hand gehen“, sagt Dr. Michael Förtsch, CEO von Q.ANT. „Zum ersten Mal können Entwickler KI-Anwendungen erstellen und die Möglichkeiten des photonischen Rechnens erkunden, insbesondere für komplexe, nichtlineare Berechnungen. Experten haben beispielsweise errechnet, dass eine GPT-4-Anfrage heute 10-mal mehr Strom verbraucht als eine normale Internet-Suchanfrage. Unsere photonischen Chips bieten das Potenzial, den Energieverbrauch für diese Abfrage um das 30-fache zu senken.“
Der Durchbruch von Q.ANT beruht auf der firmeneigenen LENA-Plattform, die Thin-Film Lithium Niobate (TFLN) on Insulator umfasst. Q.ANT hat dieses photonische Material seit seiner Gründung im Jahr 2018 kontinuierlich weiterentwickelt. Diese Plattform ermöglicht eine präzise Lichtsteuerung auf Chipebene. Q.ANT kontrolliert den gesamten Prozess vom Wafer bis zum fertigen Prozessor und nutzt sein tiefes Verständnis von Licht. Damit erreicht das Unternehmen eine mathematische und algorithmische Dichte, die die herkömmliche CMOS-Technologie übertrifft. So kann beispielsweise eine Fourier-Transformation, die in der herkömmlichen CMOS-Technologie Millionen von Transistoren erfordert, mit einem einzigen optischen Element durchgeführt werden.
„Der neuartige Ansatz von Q.ANT für die photonische Verarbeitung ist ein großer Schritt, um den steigenden Energiebedarf der KI-Ära zu decken“, sagt Dr. Eric Mounier, Chefanalyst, Photonics & Sensing beim Analystenhaus Yole-Group. „Dieser Durchbruch wird durch die Verwendung optimaler Materialien für optische Schaltkreise ermöglicht, die Q.ANT in den letzten Jahren entwickelt hat. Diese neue Prozessorgeneration öffnet endlich den Zugang zu überlegenen mathematischen Operationen, die auf herkömmlichen GPUs zu energieaufwändig waren. Erste Leistungssteigerungen werden bei AI-Inference und AI-Training erwartet, was den Weg für hocheffizientes, nachhaltiges KI-Computing ebnet.“
Schnellere Lösungen bei geringerem Energieverbrauch
Die Q.ANT NPU kann die Berechnungsanforderungen für Machine-Learning, Computer-Vision oder für das Training und die Inferenz großer Sprachmodelle (LLM) reduzieren.
Testläufe mit dem Q.ANT NPU-Demosystem in der Cloud mit MNIST-Datensätzen ergaben, dass der Native-Computing-Ansatz von Q.ANT eine mit linearen Netzen vergleichbare Genauigkeit bei weniger Energieverbrauch erreicht.
Auch konnte in Simulationen von Kolmogorov-Arnold-Networks (KAN) Simulationen gezeigt werden, dass 43 Prozent weniger Parameter benötigt und die Anzahl der Operationen um 46 Prozent reduziert werden kann, was ihn als effizientere Wahl für KI-Inferenz etabliert.
Weitere Tests und Simulationen zur Bilderkennung zeigen, dass die Q.ANT NPU deutlich schneller trainieren kann und eine genaue Erkennung mit nur 0,1 Millionen Parametern und 0,2 Millionen Operationen erreicht. Ein herkömmlicher Ansatz hat selbst bei 5,1 Millionen Parametern und 10 Millionen Operationen Mühe, akzeptable Ergebnisse zu erzielen.
Außerdem ermöglicht sie schnellere Lösungen für partielle Differentialgleichungen in Physiksimulationen, vereinfacht die Zeitreihenanalyse und verbessert die Effizienz bei der Lösung von Problemen der Graphentheorie. Im Gegensatz zur Standard CMOS-Technologie verarbeitet die Q.ANT NPU Daten über Licht und ermöglicht so energieeffizientere mathematische Operationen. Während ein herkömmlicher CMOS-Multiplikator 1.200 Transistoren benötigt, um eine einfache 8-Bit-Multiplikation durchzuführen, erreicht die Q.ANT NPU dies mit einem einzigen optischen Element.
Verfügbarkeit und Verpackung
Die Q.ANT NPU kann ab sofort bestellt werden und ist im Februar 2025 lieferbar. Die Q.ANT NPU ist als schlüsselfertiger Native Processing Server (NPS) erhältlich, der vollständig mit einer herkömmlichen Serverlandschaft kompatibel ist und in jedes HPC- oder Rechenzentrum integriert werden kann. Durch den frühzeitigen Zugang zu seiner photonischen Technologie will Q.ANT den Durchbruch im Computing beschleunigen und neue Möglichkeiten in der KI und der wissenschaftlichen Forschung in einem Bereich eröffnen, der in nur wenigen Jahren erhebliche Leistungssteigerungen und ein enormes Energiesparpotenzial bieten wird.
Integration mit bestehenden AI Software Stacks
Die intuitive Schnittstelle der Q.ANT NPU, das Q.ANT Toolkit, lässt sich nahtlos in bestehende KI-Software-Stacks integrieren und ermöglicht es Entwicklern, auf verschiedenen Ebenen zu arbeiten, von der Multiplikation bis zu passenden neuronalen Netzwerkoperationen. Außerdem bietet es eine umfassende Sammlung von Beispielanwendungen.