Immer öfter heißt es nicht „Dr. Google, was habe ich?“ sondern „ChatGPT, was habe ich?“ Auch sogenannte Symptom-Checker-Apps auf dem Smartphone finden immer mehr Freunde. KI-gestützte Tools, um eine erste Einschätzung zu bekommen, was die Ursachen für Beschwerden und Befindlichkeits-störungen sein könnten, werden immer populärer. Indes: Zwei Studien der TU Berlin zeigen: Die Diagnosen der Künstlichen Intelligenz können helfen, verlassen sollte man sich auf die Ergebnisse von „Dr. KI“ nicht.
Künstliche Intelligenz ist keine abstrakte Zukunftsvision mehr, sondern hält zunehmend Einzug in den Alltag der Menschen. Online-Tools wie Google Gemini, Perplexity und allen voran Marktführer ChatGPT sind besonders beliebt. Die Programme können auch nach medizinischen Informationen suchen und Symptome den dazu passenden Krankheiten zuordnen – aber sind sie damit auch ein sinnvoller (Erst-) Ratgeber für Patientinnen und Patienten? Dieser Frage gingen Wissenschaftler der TU Berlin in gleich zwei Studien des Fachgebiets Arbeitswissenschaft nach.
Das Forschungsteam um Dr. Marvin Kopka entwickelte dazu ein Testverfahren, das nicht auf idealtypischen Lehrbuchdiagnosen basiert, sondern auf realen Patientenfällen. In den beiden Studien wurden KI-Modelle (vorrangig ChatGPT) sowie sogenannte Symptom-Checker-Apps (z. B. ADA und Symptomate) mit Alltagssymptomen konfrontiert, wie sie häufig auch in der hausärztlichen Sprechstunde vorkommen. Ziel war es zu prüfen, wie realistisch, hilfreich und differenziert die Ergebnisse und die dazugehörigen Empfehlungen der digitalen Tools tatsächlich sind. „Man kann unsere standardisierte Methode als eine Art ‚Stiftung Warentest‘ ansehen, da wir mit ihr die Genauigkeit von verschiedenen Apps vergleichen können, aber auch ihre Stärken und Schwächen finden“, sagt Studienleiter Marvin Kopka.
Symptom-Checker liefern konkretere Empfehlungen
Ein erstes interessantes Ergebnis ist, dass die getesteten Symptom-Checker-Apps zumindest in der Ersteinschätzung deutlich besser abschneiden als ChatGPT. Sie können für Patienten damit durchaus hilfreich sein. Insbesondere wenn es darum geht, zwischen harmlosen Beschwerden und möglichen Notfällen zu unterscheiden, liefern die Apps eine deutlich realistischere Einschätzung als die anderen getesteten KI-Modelle und in den meisten Fällen auch fundierte und angemessene Handlungsempfehlungen.
Bei den in ChatGPT gestellten Anfragen lief es nicht so entspannt: Die KI reagierte bei den meisten Symptomen übertrieben vorsichtig. So wurde beinahe jeder Fall als potenziell behandlungsbedürftig eingestuft, und dem Patienten wurde zu einem baldigen Arztbesuch geraten. Zwar gibt es auch andere Studien, die belegen, dass ChatGPT durchaus in der Lage ist, Krankheiten korrekt zu diagnostizieren. Das gilt aber vor allem für die Fälle, in denen bereits Laborwerte oder andere ärztliche Untersuchungsergebnisse vorliegen. Das Problem hierbei: Medizinische Laien nutzen ChatGPT & Co. häufig schon vor dem ersten Arztbesuch, also für die Ersteinschätzung ihrer Symptome. Hier bleibt die Diagnose aber oft ungenau oder der Nutzer bekommt gleich eine komplette Liste mit infrage kommenden Erkrankungen. Dies hilft den Betroffenen wenig und ist eher dazu geeignet, übertriebene Ängste zu schüren.
Wie ChatGPT für volle Arztpraxen und Notaufnahmen sorgt
Aus Sicht der KI beziehungsweise ihrer Entwickler sind die Ergebnisse durchaus nachvollziehbar. Liegen keine genauen Gesundheitsdaten vor, werden eben alle infrage kommenden Ergebnisse ausgegeben. Und um sich rechtlich abzusichern, gibt es die Empfehlung des Arztbesuchs direkt hinterher. Bei betroffenen Patienten führt das aus nachvollziehbaren Gründen jedoch zu Unsicherheit – und zu unnötig häufigen Arztbesuchen.
Menschen vertrauen KI-Diagnosen nicht blind
In einer zweiten Studie analysierten die Forschenden, wie Anwender in der Praxis auf Empfehlungen der genannten KI-Tools reagieren. In Beobachtungen und bei einer Befragung von rund 600 Teilnehmenden zeigte sich: Nutzer übernehmen die Vorschläge in der Regel nicht unkritisch, sondern vergleichen sie zunächst mit anderen Quellen wie Google oder Ratschlägen von Familie und Freunden. Zudem wurde deutlich, dass die meisten Menschen tatsächliche Notfälle in der Regel schnell erkennen und entsprechend handeln. Das Problem liegt eher darin, einfache und zunächst undramatisch wirkende Symptome richtig einzuschätzen. Sucht man dann bei ChatGPT oder einer anderen KI Hilfe, ist es nicht unwahrscheinlich, dass die Betroffenen zu viele und teils unverständliche Informationen von den digitalen Tools bekommen und diese dann erst recht nicht einordnen können.
Geht es Ihnen gut? Bei allen Fragen rund ums Thema gesunde Ernährung stehen Ihnen die Expertinnen und Experten Ihrer Guten Tag Apotheke gerne zur Verfügung: Bei Bedarf lotst Sie der Apotheken-Finder zur richtigen Adresse ganz in Ihrer Nähe.
Und wenn es ganz schnell gehen muss: medi now® – der Online-Shop für Ihre Medikamente. Ein sicherer Service Ihrer Guten Tag Apotheke. Und das bedeutet für Sie:
- Ganz unkompliziert die Arzneimittel-Verfügbarkeit prüfen
- Direkt in Ihrer Nähe abholen
- Oder schnell liefern lassen