Die Ausstattung mit dem Booster-Modul wird als deutsch-französisches Projekt gemeinsam mit den Unternehmen Nvidia und Mellanox im Co-Design-Verfahren konzipiert. Mit dem Start des Boosters im Jahr 2020 soll dann die Rechenleistung von Juwels von aktuell zwölf auf über 70 Petaflops erhöht werden. Dies entspricht 70 Billiarden Rechenoperationen pro Sekunde – oder der Leistung von über 300.000 modernen PCs.
Komponenten für Booster-Modul waren nicht verfügbar
Der Jülich Wizard for European Leadership Science, kurz Juwels, folgt dem neuartigen Prinzip der in Jülich entwickelten modularen Supercomputing-Architektur. Sie sieht die Kombination unterschiedlicher Module vor, die auf verschiedene Anforderungen zugeschnitten sind. Diese lassen sich dann über eine einheitliche Systemsoftware zusammenführen und zu einem einzigen, ultraflexiblen Supercomputer zusammenschalten.
Das mit Abstand größte dieser Module ist das nun kommende, mit Grafikprozessoren ausgestattete Booster-Modul. Mit ihm sollen sich große Datenmengen und besonders rechenintensive Programmteile parallel mit hoher Effizienz bearbeiten lassen, beispielsweise bei großangelegten Simulationen oder maschinellem Lernen.
Als das erste Modul von Juwels installiert wurde, waren noch nicht alle Komponenten, die für den Bau des Boosters benötigt werden, auf dem Markt. Mittlerweile sind alle Teile erhältlich, die für ein ausgewogen konzipiertes Höchstleistungsrechenmodul erforderlich sind.
Hardware-Partner aus Europa, Israel und den USA
Der Juwels-Booster basiert auf der Supercomputer-Reihe BullSequana XH2000 von Atos. „Ausgestattet mit unseren neuen, leistungsfähigen beschleunigten Blades bietet die BullSequana-Plattform Jülich eine effektive Recheninfrastruktur auf dem Weg zu Exascale“, meint Agnès Boudot, Senior Vice President, Head of HPC & Quantum bei Atos. Mit einer patentierten Direct-Liquid-Cooling-Warmwasser-Technologie unterstütze sie außerdem das Bestreben des Forschungszentrums nach nachhaltigen Lösungen.
Eine Besonderheit des modularen Juwels-Systems ist, dass er sich gleichermaßen für Simulationen und maschinelles Lernen eignet und so beide Bereiche leicht zusammenbringen kann. Im Booster-Modul setzt das JSC dafür auch Nvidia-GPUs ein, „um diese Anforderungen bei hoher Energieeffizienz zu erfüllen“, wie Marc Hamilton, VP, Solutions Architecture and Engineering bei Nvidia, berichtet.
Die hohe Netzwerkleistung, die für den modularen Rechner benötigt wird, kommt von Mellanox aus Israel. „Unsere 200-Gbit/s-HDR-InfiniBand-Technologie bietet einen hohen Datendurchsatz und eine niedrige Latenzzeit. Sie liefert damit die Netzwerkleistung, die zur Rechenleistung der Rechenknoten des Juwels-Boosters passt“, erklärt Gilad Shainer, SVP für Marketing bei Mellanox.
Förderung durch Bund und Land
Die Anschaffung des Boosters wird vom Bund und vom Land Nordrhein-Westfalen finanziert. Das JSC betreibt Juwels als Mitglied des Gauss Centre for Supercomputing (GCS), dem Zusammenschluss der drei nationalen Höchstleistungsrechenzentren in Deutschland, zu denen die drei Rechenzentren des Forschungszentrums Jülich (JSC), der Bayerischen Akademie der Wissenschaften (LRZ) und der Universität Stuttgart (HLRS) gehören.
Die Rechenzeit wird über Peer-Review-Verfahren auf nationaler und europäischer Ebene vergeben. Das GCS und das Forschungszentrum Jülich werden unterstützt vom Bundesministerium für Bildung und Forschung (BMBF) und dem Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen sowie dem Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg und dem Bayerischen Staatsministerium für Wissenschaft und Kunst.
Nächster Schritt: Exascale-Rechner
„Die modulare Supercomputing-Architektur ermöglicht es, flexibel und ohne Kompromisse die besten verfügbaren Technologien zu integrieren“, sagt Prof. Thomas Lippert, Direktor des Jülich Supercomputing Centre. „Die Modularität ist unsere Antwort auf die zunehmend komplexeren und heterogeneren Anforderungen der Anwendungscodes an die Supercomputer. Sie erlaubt, Exascale kostengünstig zu realisieren und wird es sogar ermöglichen, so exotische Zukunftstechnologien wie Quantencomputer zu integrieren.“
Der Bau eines Exascale-Rechners wird weltweit als der nächste große Schritt auf dem Gebiet des High Performance Computing verfolgt. Ein solcher Rechner ist mit einer Trillion Rechenoperationen pro Sekunde noch um mindestens eine Größenordnung leistungsfähiger als die schnellsten aktuellen Supercomputer.
Die Idee des modularen Supercomputing wurde von Lippert konzipiert und unter Leitung von Dr. Estela Suarez, JSC, gemeinsam mit ParTec in den von der EU geförderten Forschungsprojekten Deep und Deep-Er mithilfe vieler europäischer Partner aus Forschung und Industrie in die Praxis umgesetzt. „Der Juwels-Booster ist wegweisend für die Entwicklung eines europäischen Exascale-Systems, denn auf dem Gebiet der Systemarchitektur ist Europa weltweit führend“, sagt abschließend Bernhard Frohwitter, Vorstandsvorsitzender von ParTec.