• Freier Vortrag

Untersuchung des Potenzials von Künstlicher Intelligenz zur Unterstützung medizinischen Personals bei der Beurteilung von Schilddrüsenultraschallbefunden

Appointment

Date:
Time:
Talk time:
Discussion time:
Location / Stream:
Saal C

Topics

  • Bildgebende Verfahren
    • Hals

Abstract

Einleitung: Die Beurteilung von Schilddrüsenknoten (SDK) im Ultraschall (US) kann anhand der ACR-TIRADS (Thyroid Imaging Reporting & Data System) Kriterien von 2017 erfolgen. Durch die Bewertung von Zusammensetzung, Form, Echogenität, Begrenzung und echogenen Foci ergibt sich der ACR-Score, der das Malignitätsrisiko (thyroid risk score, TRS) abschätzt und die Notwendigkeit einer Feinnadelpunktion (FNP) und eines Follow-Ups (FU) ermittelt. Diese Studie untersucht, ob Künstliche Intelligenz (KI) -Tools wie ChatGPT 4.0 medizinisches Personal bei der SDK-Beurteilung unterstützen können.

Material und Methoden: 100 fiktive US-Berichte von SDK wurden sowohl von einem ärztlichen Team als auch von ChatGPT 4.0 bewertet. ChatGPT 4.0 analysierte die Berichte zweimal, und die Ergebnisse wurden durch Intrarater-Reabilität verglichen. Die Ergebnisse von ChatGPT 4.0 und dem medizinischen Personal wurden mittels Interrater-Reabilität und Cohens Kappa bewertet.

Ergebnisse: Die Intrarater-Reabilität der KI zeigte variable Konsistenz in der Bewertung der SDK-Kriterien. ChatGPT 4.0 konnte die Form der SDK nicht beurteilen. Im Vergleich zum ärztlichen Personal erzielte es moderate Interrater-Reabilität für ACR-Score, TRS, FNP und FU-Empfehlungen, zeigte jedoch nahezu perfekte Übereinstimmung bei Echogenität, Begrenzung und echogenen Foci.

Diskussion: Die Studie betont die Herausforderungen bei der Integration von KI-Tools in die Diagnostik. ChatGPT 4.0 zeigte Potenzial, aber auch Inkonsistenzen bei der Einhaltung der ACR-TIRADS-Kriterien. Verbesserungen sind nötig, um KI für die Optimierung diagnostischer Abläufe und des Patient*innenmanagements bei SDK-US-Befunden verlässlich nutzen zu können.

nein