Die Qualität der Daten ist wichtig
Interview aus Saarland
Prof. Dr Ralf Möller leitet am Deutschen Forschungsinstitut für Künstliche Intelligenz (DFKI), das auch in Saarbrücken einen großen Standort hat, in Lübeck den Bereich Stochastische Relationale KI im Gesundheitswesen. Im Gespräch hat er Chancen und Risiken von Big Data und KI im Gesundheitswesen bewertet.
TK: Sehr geehrter Herr Prof. Dr. Möller, es heißt immer "Daten sind das neue Gold". Warum ist das so und ist diese Entwicklung gut oder gefährlich?
Prof. Dr. Ralf Möller: Diesen Spruch würde ich nur bedingt unterschreiben. Aus zur Verfügung stehenden Daten lassen sich gewisse Erkenntnisse gewinnen. Das ist aber nicht ganz trivial. Man muss die Semantik der Daten kennen und vor allem deren Qualität gewährleisten können. Das Bild, dass man jemanden an eine fremde Datenbank setzt und dieser ad-hoc wichtige und aussagekräftige Auswertungen erstellen kann, ist falsch. Man muss sowohl die Daten durchdringen als auch die Materie verstehen.
Die Entwicklung der Datenauswertung bietet einerseits viel Potenzial, andererseits aber auch Herausforderungen. Wenn ein intelligentes System nur als Assistenz für Ärztinnen und Ärzte fungiert, kann man auch mit kleineren Fehlern leben, weil das Fachpersonal die Ausreißer erkennt. Schwieriger wird es aber unter Umständen, wenn ein intelligentes System direkt und ohne menschliche Zwischenkontrolle eine Behandlung oder ähnliches auslöst. Da können diese kleinen Fehler, die eventuell in den Trainingsdaten vorliegen oder sich aus dem Lernverfahren ergeben, schwerwiegende Folgen haben. Daher ist die Qualität der Daten von grundlegender Bedeutung.
TK: Welche Rolle wird aus Ihrer Sicht Künstliche Intelligenz und Big Data im Gesundheitswesen der Zukunft spielen?
Prof. Dr. Möller: Beides wird in der Zukunft eine immer größere Rolle spielen. Im Gesundheitswesen müssen Big Data und KI miteinander verknüpft werden. Das Problem ist aktuell aber, dass die relevanten Datenmengen entweder noch nicht groß genug sind oder aber die Qualität nicht gut genug ist. Die Herausforderung bei Big Data besteht also darin, qualitativ gute Datensätze in einer realistischen Größe zu generieren.
Aktuell werden Daten vielfach nur klassifiziert, beispielsweise, ob Tumorstrukturen vorhanden sind oder nicht. Richtig interessant wird es aber, wenn Prädiktionen, also Vorhersagen getroffen werden. Zum Beispiel: Patient XY wird mit einer Wahrscheinlichkeit von über 95 Prozent in den kommenden beiden Jahren an einer bestimmten Krebsart erkranken. Aus diesen Erkenntnissen müssten dann Handlungsempfehlungen abgeleitet werden. Hier kommt dann KI ins Spiel. Allerdings können intelligente Systeme nach bisherigen Erfahrungen nur dann effektiv in Aktion treten, wenn von ihnen auch eine Handlungsempfehlung generiert, diese umgesetzt wird und die Effekte der Handlungen analysiert werden. Das ist allerdings bei Behandlungen von Menschen schwierig. Daher ist es wichtig, Simulatoren zu entwerfen, über die dann in einer hohen Geschwindigkeit verschiedene Optionen durchgespielt und analysiert werden können. So könne die intelligenten Systeme durch Rückkopplung in ihrer Handlungskompetenz besser werden. Ein Schachcomputer wird auch erst richtig gut, wenn er gegen andere Computer antritt und daraus lernt.
TK: Wie kann das Saarland und das Gesundheitswesen vor Ort von KI und Datennutzung profitieren?
Prof. Dr. Möller: Mit dem Deutschen Forschungsinstitut für Künstliche Intelligenz (DFKI) in Saarbrücken und dem IT-Schwerpunkt an der Universität des Saarlandes gibt es vor Ort viel Know-how. Durch Kooperationen und Projekte können viele interessante Problemstellungen und Forschungsansätze beleuchtet werden. Davon könnten die Player vor Ort dann entsprechend profitieren. Die Forschung ist in diesem Bereich auf einem guten Weg. Durchaus sehr wichtige Entwicklungen finden auch außerhalb der großen amerikanischen Tech-Unternehmen mit großer PR-Abteilung statt. Allerdings erhalten diese unter Umständen weniger Aufmerksamkeit in den Medien als sie verdient hätten.
TK: Auch im Gesundheitssektor sind immer mehr Daten vorhanden. Diese sind natürlich sehr sensibel. Welche Schutzmaßnahmen müssen geschaffen werden, damit diese Daten in der Forschung, aber auch von uns Krankenkassen sicher genutzt werden können?
Prof. Dr. Möller: Eine personenbezogene Anonymisierung ist derzeit im Gesundheitssektor der Standard. Allerdings sind je nach Größe der zur Auswertung beziehungsweise der zum Lernen verwendeten Datenmenge und verfügbarer weitere Daten durchaus Rückschlüsse auf scheinbar anonymisierte Aspekte der Originaldaten mit hoher Genauigkeit möglich. Die Frage, ob jemand an einer Studie teilgenommen hat oder nicht, kann also unter Umständen ungewollt mit hoher Sicherheit korrekt beantwortet werden.
Wenn aber die Teilnehmenden an einer Studie ihre Daten bewusst freigegeben haben, sollte man die Möglichkeit der Datenauswertung auch konsequent nutzen. Wir müssen beim Schutz der Daten alles technisch umsetzbare möglich machen. Gleichzeitig sollte aber verhindert werden, dass der Datenschutz die Verwendung bestehender Datensätze gänzlich unbrauchbar macht. Auf der anderen Seite sollte man aber auch nicht dem Irrglauben verfallen, dass mehr Daten grundsätzlich auch immer mehr Einsichten bedeuten. In manchen Kontexten sind durch weitere Daten keine weiteren Erkenntnisse möglich. Allerdings könnten durch sie Rückschlüsse auf einzelne Personen möglich werden, was der Sicherheit schaden würde. Daher gilt es bei der Erhebung und Auswertung von Daten, Vor- und Nachteile klar abzuwägen.
Zur Person
Prof. Dr. Ralf Möller hat an der Universität Hamburg im Bereich Informatik dissertiert und habilitiert. Seit 2001 hat er an verschiedenen Universitäten eine Professur inne. Beim Deutschen Forschungszentrum für Künstliche Intelligenz in Lübeck leitet er sei 2021 den Forschungsbereich Stochastische Relationale KI im Gesundheitswesen.