Neuer Deep-Learning-Ansatz Maschinelles Lernen: Neue Ära für die Materialwissenschaften?

Momentaufnahme einer Deep-Learning-Simulation mit mehr als 10.000 Berylliumatomen

Bild: HZDR / CASUS
11.07.2023

Eine neue Simulationsmethode ermöglicht präzise Berechnung der elektronischen Struktur in Materialforschung und Anwendungen wie Arzneimitteldesign und Energiespeicherung. Die Forschenden des CASUS und der Sandia National Laboratories entwickelten eine auf maschinellem Lernen basierende Methode, die herkömmliche Verfahren übertrifft.

Die Anordnung von Elektronen in Materie, die so genannte elektronische Struktur, spielt nicht nur in der Grundlagenforschung eine entscheidende Rolle, sondern auch bei angewandter Forschung wie dem Arzneimitteldesign oder der Energiespeicherung. Lange Zeit fehlten jedoch Simulationsmethoden, die sowohl eine hohe Genauigkeit als auch Skalierbarkeit über verschiedene Zeit- und Längenskalen hinweg bieten.

Bisher unerreicht

Forscher des Center for Advanced Systems Understanding (CASUS) am Helmholtz-Zentrum Dresden-Rossendorf (HZDR) in Görlitz und der Sandia National Laboratories in Albuquerque, USA, haben nun eine auf maschinellem Lernen basierende Simulationsmethode entwickelt, die herkömmliche Verfahren zur Simulation elektronischer Strukturen übertrifft. Ihr Softwarepaket MALA (Materials Learning Algorithms) ermöglicht den Zugang zu bisher unerreichten Längenskalen.

Elektronen sind Elementarteilchen von grundlegender Bedeutung. Ihre quantenmechanischen Wechselwirkungen untereinander und mit den Atomkernen sind verantwortlich für eine Vielzahl von Phänomenen in der Chemie und den Materialwissenschaften. Verständnis und Kontrolle der elektronischen Struktur der Materie geben Aufschluss über die Reaktivität von Molekülen, die Struktur von Planeten und den Energietransport in ihnen sowie über die Mechanismen bei Materialversagen.

Wissenschaftliche Herausforderungen werden immer häufiger durch computergestützte Modellierung und Simulationen angegangen, wobei hier die Möglichkeiten des Hochleistungsrechnens voll zum Tragen kommen. Für realistische Simulationen mit Quantenpräzision fehlte allerdings ein vorhersagendes Simulationsverfahren, das hohe Genauigkeit mit Skalierbarkeit über verschiedene Längen- und Zeitskalen kombiniert. Klassische atomistische Simulationsmethoden können zwar große und komplexe Systeme handhaben.

Da sie die elektronische Quantenstruktur nicht berücksichtigen, ist ihre Anwendbarkeit jedoch eingeschränkt. Umgekehrt bieten Simulationsmethoden, die im Gegensatz zur empirischen Modellierung ausschließlich auf Grundlage analytischer Formeln arbeiten (ab initio-Methoden), eine hohe Genauigkeit. Sie sind aber rechenintensiv. Die Dichtefunktionaltheorie (DFT), eine weit verbreitete ab initio-Methode, skaliert beispielsweise kubisch mit der Systemgröße. Das beschränkt diese Methode auf kleine Skalen.

Hybrider Ansatz auf der Grundlage von Deep Learning

Das Team hat nun ein neuartiges Simulationsverfahren vorgestellt: das „Materials Learning Algorithms (MALA) software stack“. In der Informatik ist ein „software stack“ eine Sammlung von Algorithmen und Softwarekomponenten, die kombiniert werden, um eine Softwareanwendung zur Lösung eines bestimmten Problems zu erstellen.

Lenz Fiedler, Doktorand und maßgeblicher Entwickler von MALA am CASUS, erklärt: „MALA integriert maschinelles Lernen mit Ansätzen aus der Physik, um die elektronische Struktur von Materialien vorherzusagen. Es verwendet einen hybriden Ansatz, bei dem eine etablierte Methode des maschinellen Lernens, das sogenannte Deep Learning, zur genauen Vorhersage lokaler Größen eingesetzt wird. Die Vorhersagen werden dann durch physikalische Algorithmen zur Berechnung relevanter Eigenschaften genutzt.“

Das Softwarepaket MALA nimmt die Anordnung der Atome im Raum als Eingabe und erzeugt Fingerabdrücke, sogenannte Bispektrumskomponenten, die die räumliche Anordnung dieser Atome um einen Punkt im Raum kodieren. Das maschinelle Lernmodell in MALA wird trainiert, um die elektronische Struktur auf der Grundlage der Nachbarschaft der Atome vorherzusagen. Ein wesentlicher Vorteil von MALA ist die Fähigkeit seines maschinellen Lernmodells, unabhängig von der Systemgröße zu sein. Es kann daher auf Daten von kleinen Systemen trainiert und danach in jeder Größenordnung eingesetzt werden.

In ihrer Veröffentlichung belegen die Wissenschaftler die bemerkenswerte Effizienz dieser Strategie. Im Vergleich zu herkömmlichen Algorithmen erreichten sie bei kleineren Systemen von bis zu einigen Tausend Atomen eine mehr als 1.000-fache Geschwindigkeitssteigerung. Darüber hinaus demonstrierten sie, dass MALA in der Lage ist, elektronische Strukturberechnungen in großem Maßstab mit mehr als 100.000 Atomen durchzuführen. Letzteres gelang mit einem überschaubaren Rechenaufwand, was die Begrenzungen herkömmlicher DFT-Codes verdeutlicht.

Attila Cangi, der kommissarische Leiter der CASUS-Abteilung „Materie unter extremen Bedingungen“, erklärt: „Mit zunehmender Systemgröße und mehr beteiligten Atomen werden DFT-Berechnungen unpraktikabel, während der Geschwindigkeitsvorteil von MALA immer größer wird. Der entscheidende Durchbruch bei MALA ist die Fähigkeit, mit lokalen Atomumgebungen zu arbeiten. Das ermöglicht genaue numerische Vorhersagen, die von der Systemgröße nur minimal beeinflusst werden. Diese bahnbrechende Errungenschaft eröffnet Berechnungsmöglichkeiten, die früher als unerreichbar galten.“

Impulse für die angewandte Forschung erwartet

Cangi hat sich zum Ziel gesetzt, durch den Einsatz von maschinellem Lernen die Grenzen der elektronischen Strukturberechnung zu erweitern: „Wir verfügen nun über eine Methode, mit der wir wesentlich größere Systeme mit einer beispiellosen Geschwindigkeit simulieren können. Ich erwarte, dass MALA einen Umbruch einleiten wird, wie elektronische Strukturen berechnet werden.“

Er führt fort: „Die Forschung wird künftig in der Lage sein, ein breites Spektrum gesellschaftlicher Herausforderungen auf Basis einer deutlich verbesserten Ausgangslage zu bearbeiten: von der Entwicklung neuer Impfstoffe und neuartiger Materialien für die Energiespeicherung über groß angelegte Simulationen von Halbleiterbauelementen und der Untersuchung von Materialdefekten bis hin zur Erforschung chemischer Reaktionen zur Umwandlung von klimaschädlichem Kohlendioxid in klimafreundliche Mineralien.“

Darüber hinaus eignet sich der MALA-Ansatz besonders für das Hochleistungsrechnen (high-performance computing, HPC). Mit zunehmender Systemgröße ermöglicht MALA eine unabhängige Verarbeitung auf dem von ihm genutzten Rechengitter, wodurch HPC-Ressourcen (insbesondere Grafikprozessoren) effektiv genutzt werden.

Siva Rajamanickam, wissenschaftlicher Mitarbeiter und Experte für paralleles Rechnen an den Sandia National Laboratories, erklärt: „Der MALA-Algorithmus für elektronische Strukturberechnungen lässt sich gut auf modernen HPC-Systemen mit verteilten Beschleunigern anwenden. Die Fähigkeit, Rechenprozesse zu zerlegen und sie auf verschiedenen Gitterpunkten über verschiedene Beschleuniger hinweg parallel auszuführen, macht MALA zu einer idealen Lösung für skalierbares maschinelles Lernen auf HPC-Ressourcen. Dabei werden eine beispiellose Geschwindigkeit und Effizienz bei der Berechnung elektronischer Strukturen erreicht.“

Außer bei den Entwicklungspartnern HZDR und Sandia National Laboratories kommt MALA bereits bei Einrichtungen und Unternehmen wie dem Georgia Institute of Technology, der North Carolina A&T State University, Sambanova Systems Inc. und der Nvidia Corp. zum Einsatz.

Verwandte Artikel