Auf dem Gebiet der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) wächst die Zahl der wissenschaftlichen Veröffentlichungen exponentiell und verdoppelt sich etwa alle 23 Monate. Für menschliche Forscher ist es schwierig bis kaum möglich, den Fortschritt zu verfolgen und einen gesamten Überblick zu behalten.
Mario Krenn, Forschungsgruppenleiter am Max-Planck-Institut für die Physik des Lichts in Erlangen, nähert sich der Lösung dieser Herausforderung auf unkonventionelle Weise und hat mit seinem neuen graphenbasierten „Science4Cast“ ein Werkzeug entwickelt, mit dem sich Fragen zur zukünftigen Entwicklung der KI-Forschung stellen lassen.
Wettbewerb ausschlaggebend
Im Vorfeld hatte die internationale Forschungsgruppe den „Science4Cast“-Wettbewerb ausgeschrieben, mit der Zielsetzung, die Entwicklung wissenschaftlicher Konzepte im Bereich KI-Forschung zu erfassen und vorherzusagen, welche Themen Gegenstand künftiger Forschung sein werden. Mehr als 50 Beiträge mit unterschiedlichen Herangehensweisen wurden im Wettbewerb eingereicht.
Krenn hat jetzt gemeinsam mit den bestplatzierten Teams die verschiedenen angewendeten Methoden untersucht, welche von rein statistischen bis hin zu reinen Lernmethoden reichten, und kam zu überraschenden Ergebnissen. „Die leistungsstärksten Methoden verwenden einen sorgfältig kuratierten Satz von Netzwerkmerkmalen und nicht einen durchgängigen KI-Ansatz“, so Krenn. Dies deutet auf ein großes Potenzial hin, das bei reinen ML-Ansätzen ohne menschliches Wissen freigesetzt werden kann.
Verknotetes Wissen
Science4Cast ist eine graphbasierte Darstellung von Wissen, das über die Zeit komplexer wird, je mehr wissenschaftliche Artikel veröffentlicht werden. Ein Knotenpunkt des Graphen repräsentiert jeweils ein KI-Konzept, und die Verbindungen zwischen den Knoten geben an, ob und wann zwei Konzepte gemeinsam erforscht wurden.
Beispielsweise kann die Fragestellung „Was wird passieren“ dadurch in eine mathematische Frage zur weiteren Entwicklung des Graphen beschrieben werden. Science4Cast ist mit realen Daten aus über 100.000 wissenschaftlichen Publikationen gefüttert aus einem Zeitraum von 30 Jahren mit insgesamt 64.000 Knoten.
Die Vorhersage, woran Forscher in der Zukunft arbeiten werden ist aber nur ein erster Schritt. Die Forscher beschreiben in ihrer Arbeit wie eine Weiterentwicklung von Science4Cast bald personalisiert Vorschläge für die jeweiligen Wissenschaftler zu ihren zukünftigen Forschungsprojekten geben könnte. „Unsere Ambition ist, eine Methode zu entwickeln, die für Wissenschaftler als Inspirationsquelle dient – quasi als künstliche Muse. Damit könnte der Fortschritt der Wissenschaft in der Zukunft beschleunigt werden“, erklärt Krenn.