Risikoreiche generative KI soll geprüft werden

„Die Prüfung generativer KI mit systemischen Risiken benötigt klar definierte Ziele, abgegrenzte Rollen sowie Anreiz- und Koordinierungssysteme für alle Beteiligten. Nur so sind verlässliche Prüfergebnisse zu erwarten - und diese sollten in standardisierter Form veröffentlicht werden. Um Interessenkonflikte zu vermeiden, sollte die Prüfung durch unabhängige Dritte durchgeführt werden. Als externe Dienstleistung kann so ein spezialisierter Markt für KI-Sicherheitstests entstehen“, fasst Dr. Dominik Rehse, Ko-Autor des Vorschlags und Leiter der ZEW-Nachwuchsforschungsgruppe „Design digitaler Märkte“, zusammen.

Die Regeln der KI-Verordnung müssen präzisiert werden

Die KI-Verordnung sieht vor, dass betreffende KI-Modelle durch sogenanntes Adversarial Testing systematisch auf Schwachstellen geprüft werden. Dabei handelt es sich um Stresstests, die darauf ausgelegt sind die KI-Modelle durch wiederholte Interaktion zu unerwünschtem Verhalten zu provozieren.

„Allerdings ist das Adversarial Testing in der KI-Verordnung nicht genauer geregelt. Die Vorgabe verweist lediglich auf Verhaltenskodizes und harmonisierte Standards, die nun entwickelt werden. Es gilt, diese Kodizes und Standards so zu gestalten, dass sie zu einer effizienten und effektiven Prüfung führen“, so Rehse.

Prüfung mit Red Teaming braucht klares Ziel

Hierfür eignet sich aus Sicht der ZEW-Wissenschaftler insbesondere das sogenannte Red Teaming. Diese umfassendere Form des geforderten Adversarial Testing bezieht zusätzlich verschiedene Arten von Angriffen auf das Modell selbst ein.

„Internes Red Teaming wird zwar nach eigenem Bekunden von den meisten großen KI-Entwicklungshäusern bereits durchgeführt, allerdings gibt es dafür keine standardisierten Ansätze, auch nicht für KI-Modelle desselben Typs. Dadurch wird der Vergleich der Ergebnisse unnötig erschwert. Vor allem fehlt bei den derzeitigen Versuchen meist ein klar definiertes Ziel, sodass unklar ist, ob und wann ein Modell ausreichend getestet wurde“, kritisiert ZEW-Wissenschaftler Sebastian Valet, Ko-Autor aus dem Forschungsbereich „Digitale Ökonomie“.

Die vier definierte Rollen

Entsprechend müssen für das Red Teaming klare Strukturen und Rollen definiert werden, damit die Potenziale dieses Prüfverfahrens effizient genutzt werden können. Die ZEW-Wissenschaftler schlagen dafür vier definierte Rollen vor, die je eigene Aufgaben, Ziele und Anreize haben, um den Prüfprozess möglichst effizient zu gestalten. Die Rollen sind:

die Organisatoren der Prüfung
das testende Red Team
Validierer, die entscheiden, ob tatsächlich ein Fehlverhalten gefunden wurde
das KI-Entwicklerteam

Jede dieser Rollen sollte dabei von unabhängigen Einheiten ausgefüllt werden. Nur so hat beispielsweise ein testendes Red Team einen Anreiz seine Aufgabe bestmöglich zu erfüllen.

„Ähnlich wie bei der externen Rechnungsprüfung darauf spezialisierte Unternehmen beauftragt werden, sollte auch das Red Teaming an externe Prüfstellen gegeben werden. Dabei sollten die KI-Entwicklungshäuser die Kosten für ein unabhängiges Red Teaming tragen: Da der Prüfprozess günstiger ist, je weniger Fehlverhalten gefunden wird, haben die Entwickler so einen Anreiz, ihre Modelle bereits im Vorfeld so gut wie möglich zu testen“, erklärt Ko-Autor Johannes Walter aus dem ZEW-Forschungsbereich „Digitale Ökonomie“.

KI-Anwendungen kommen unter Realbedingungen auf den Prüfstand

Schlüsselkomponenten für humanoide Roboter

Simulations-Software soll bei der Atommüll-Endlagersuche helfen

Hochspannungs-Seekabel herstellunabhängig reparieren

Systematisch Schwachstellen finden Risikoreiche generative KI soll geprüft werden

Die Regeln der KI-Verordnung müssen präzisiert werden

Prüfung mit Red Teaming braucht klares Ziel

Die vier definierte Rollen

ZEW – Leibniz-Zentrum für Europäische Wirtschaftsforschung GmbH Mannheim

Recycling, Aufbereitung, Veredlung: Neue Wege in der Batteriefertigung

Unternehmen wünschen sich „GenAI made in Europe“

Vier Schritte, um die verspätete NIS2-Umsetzung erfolgreich vorzubereiten

KI-fähiger Rugged-Computer

Ab 2026 verpflichtend: So bereiten sich Hersteller auf den Cyber Resilience Act vor

Reality-Check für H₂: EU-Ziele 2030 wahrscheinlich nicht erreichbar

Maßgeschneiderte Automatisierung für den produzierenden Mittelstand

Simulations-Software soll bei der Atommüll-Endlagersuche helfen

Sechs Voraussetzungen für erfolgreiches Edge Computing

Flexibel einsetzbare, digitale Hochgeschwindigkeits-Sicherheits-E/A