Prof. Dr. Björn Schuller und sein Team von der Universität Augsburg widmen sich seit mehreren Jahren Stimmanalysen an der Schnittstelle zwischen Informatik und Medizin. 2012 haben die Wissenschaftler bereits Kehlkopfkrebs „gehört“, danach Autismus (2013), Parkinson (2015) und Erkältungen (2016). Auch an der akustischen Erkennung von Krankheitsbildern wie Depressionen oder Epilepsien wird gearbeitet.
Mit der Pandemie hat sich dieses Forschungsfeld verändert: Schon im März 2020 erhielt das Entwickler-Team die Möglichkeit, zum Covid-19-Virus zu forschen. Das neue Ziel: Eine für niedergelassene Ärzte und Interessierte unkomplizierte Anwendung auf Basis von Smartphone-Technologie zu entwickeln, die das Erkennen einer Covid-19-Infektion berührungslos, in Echtzeit und sogar auf Distanz ermöglicht.
Stimmproben aus Wuhan und Augsburg
Im März 2020 begann Schuller, Stimmaufnahmen aus Wuhan, die er von chinesischen Kollegen erhielt, auszuwerten. Insgesamt verarbeitete das Team zunächst etwa 50 Stimmen von Covid-19-Patienten und etwa 50 Stimmen von nicht infizierten Patienten.
„Diese Auswertungen waren erste Lernbeispiele für unseren Computer. Je mehr Stimmen wir auswerten können, umso genauer kann die App später funktionieren“, erklärt Schuller. Inzwischen erhalten die Informatiker die Daten aus dem Universitätsklinikum Augsburg. „Leider, muss man sagen.“
Corona-Verdachtsfälle schnell erkennen
Die Stimmproben werden jetzt gemeinsam mit Ärzten im Universitätsklinikum Augsburg aufgenommen. Schuller arbeitet dort mit Privatdozent Dr. Markus Wehler, Direktor der IV. Medizinischen Klinik sowie der Zentralen Notaufnahme des Universitätsklinikums Augsburg, zusammen.
„Aus Sicht der Notfall- und Akutmedizin wäre ein solches Instrument sehr hilfreich, da ein Sprachtest sehr schnell durchzuführen und wenig belastend ist und innerhalb weniger Minuten ein Ergebnis vorliegt“, sagt Wehler. Es sei keine Blutabnahme nötig, kein Röntgenbild und auch sonst keine aufwendige Diagnostik – ein großer Vorteil. „Selbst wenn das Ergebnis nicht so genau wie bei einem Abstrich ist, könnte man dennoch sehr schnell die Verdachts- von den Nicht-Verdachtsfällen trennen“, erklärt der Notfallmediziner.
Für Schuller liegt der Vorteil dieser Zusammenarbeit auf der Hand: „So liegen auch verlässliche Tests vor. Anhand dieser lernt der Computer selbst, worauf er achten muss, um Covid-19 und eben nicht Covid-19 voneinander unterscheiden zu können.“
Inzwischen liegt die Erfolgsquote der Spracherkennungs-App laut Schuller bei über 80 Prozent. „Aber wir sind noch mitten in der Untersuchung“, sagt er, „brauchen natürlich weitere Daten, also viele Stimmen sowohl von Covid-19-Erkrankten als auch von gesunden Vergleichskandidaten.“
So funktioniert die Spracherkennungs-App
Die App lernt mit tiefen neuronalen Netzen, die wesentlichen Merkmale in der Stimme zu repräsentieren, um dann anhand dieser eine Entscheidung zu treffen. „Man kann sich vorstellen, dass sie Covid-19 Einflüsse auf die Stimmbildung heraushören kann, etwa Kurzatmigkeit oder auch einfach Ermüdung und natürlich Husten oder Ähnliches“, beschreibt Schuller.
Die tiefenneuronalen Netzwerke erlernen dabei ähnlich wie das menschliche Gehirn, hoch parallel Information zu verarbeiten. In Ebenen bilden sie das Sprachsignal mit zunehmender Komplexität ab und können nach dem Anlernen mit vielen Daten neue Probleme wie Covid-19 selbstständig darstellen und erkennen.
Somit lernt der Computer beziehungsweise die App, Covid-19 schon nach wenigen Worten oder Sätzen auch von neuen Personen aus der Stimme zu erkennen. Parallel hat Schuller eine weitere App entwickelt, die über einen längeren Zeitraum zuhört und Häufigkeiten von hörbaren Symptomen wie Husten, Niesen, Kurzatmigkeit, verstopfter Nase und so weiter beobachtet, aus dem „Gehörten“ Rückschlüsse zieht und den Nutzer informiert.
Nächste Schritte
„Wir hoffen, mit unserer Anwendung einen wichtigen Beitrag zur Früherkennung von Covid-19-Verdacht leisten zu können“, sagt Schuller. Die Sprache sei hierbei quasi „das neue Blut“, das die Forscher aber genauso dringend als Spende benötigen, um ihre Systeme zu verbessern. „Natürlich stehen Privatsphäre und Ethik dabei stets an erster Stelle“, betont Schuller. „Wir entwickeln daher Lösungen, die direkt auf dem Endgerät eines Nutzers die Daten auswerten und nur für den Nutzer einsehbar sind.“
Noch ist das Projekt Spracherkennung von Covid-19 also noch nicht abgeschlossen. Schuller gibt einen Ausblick: „Wir beschäftigen uns neben der Verbesserung der Zuverlässigkeit mit einer erhöhten Erklärbarkeit der Analyse und erhöhten Transparenz der Entscheidung. Natürlich sind wir dann in erster Linie daran interessiert, dass Projekt in eine reale Anwendung überführen zu können, um für uns alle einen Mehrwert in dieser herausfordernden Zeit leisten zu schaffen.“
Noch gibt es keine Partner für die Covid-19-Spracherkennungs-App. Schuller will aber auch mit seiner Firma Audeering an Lösungen arbeiten, die entsprechend bereitgestellt werden können.