Dr. med. KI – Einführung in die künstliche Intelligenz

Der erste Teil der Kursreihe „Dr. med. KI“ bietet eine verständliche Einführung in das Thema künstliche Intelligenz (KI) und einige ihrer wichtigen Teilgebiete. Im zweiten Teil werden relevante medizinische KI-Anwendungen vorgestellt.

Das Datenvolumen im Gesundheitswesen wächst exponentiell und stellt eine Herausforderung für die Behandelnden dar. Künstliche Intelligenz (KI) bezeichnet die Eigenschaft von Computern, mit einer „menschenartigen“ Autonomie Inputdaten auszuwerten und Aktionen auszuführen, um bestimmte Ziele zu erreichen. KI gilt als Schlüsseltechnologie, um das Potential großer Datenmengen (Big Data) voll ausschöpfen zu können. Für die Medizin sind die KI-Teilgebiete Maschinelles Lernen (ML), artifizielle Neuronale Netze (NN) und Deep Learning besonders relevant. Deep Learning bezeichnet den Einsatz komplexer NN. Diese zeichnen sich durch eine hervorragende Performance im Erkennen von Mustern und Zusammenhängen in komplexen Datensätzen aus. Voraussetzung für einen erfolgreichen Einsatz von Deep Learning und anderen ML-Verfahren sind jedoch ausreichend große und qualitativ hochwertige Datensätze.


Kursinfo
VNR-Nummer 2760709122061740018
Zeitraum 26.06.2022 - 25.06.2023
Zertifiziert in D, A
Zertifiziert durch Akademie für Ärztliche Fortbildung Rheinland Pfalz
CME-Punkte 2 Punkte (Kategorie D)
Zielgruppe Ärzte
Autor Prof. Dr. rer. nat. Kerstin Ritter
Redaktion CME-Verlag
Veranstaltungstyp Interaktiver Webcast
Lernmaterial Audio-Vorträge, Quizze, Handout (pdf), Lernerfolgskontrolle
Fortbildungspartner Stifterverband für die Deutsche Wissenschaft e.V.
Bewertung 3.7 (190)

Einführung

Spätestens seit den 1960er-Jahren wächst das weltweite medizinische Datenvolumen exponentiell. Mit zunehmender Digitalisierung in allen Lebensbereichen nimmt die Datenmenge weiter zu. Der Begriff „Big Data” fand zuerst in den 1990er-Jahren breite Verwendung. Hierunter versteht man Daten, die ein großes Volumen umfassen, eine beträchtliche Heterogenität aufweisen und mit steigender Geschwindigkeit generiert werden. Durch Auswertung von Big Data soll das Gesundheitswesen verbessert und die Patient:innenversorgung optimiert werden. Das enorme Datenvolumen, die Geschwindigkeit seiner Erzeugung und die Vielfalt der unterschiedlichen Datendomänen übersteigen das menschliche Verarbeitungsvermögen. Daher benötigt man zu ihrer Auswertung die Nutzung von Computertechnologien und Algorithmen. Die Entwicklung leistungsstarker Computer ermöglichte die Einführung der Künstlichen Intelligenz (KI; engl. artificial intelligence, AI). Die Themen KI und Big Data stehen zunehmend im Fokus des fachlichen Diskurses und der öffentlichen Aufmerksamkeit. Die Bundesregierung hat im November 2018 die „Strategie Künstliche Intelligenz” (KI-Strategie) beschlossen. Diese soll der Erforschung und Anwendung von KI in Deutschland und Europa einen Schub versetzen.

Was ist Künstliche Intelligenz?

KI ist ein Sammelbegriff für Technologien und Algorithmen, die ein scheinbar intelligentes Verhalten in Computersystemen implementieren. KI-Systeme identifizieren Muster und Zusammenhänge in Daten und können somit für Vorhersagen und Handlungsempfehlungen genutzt werden. Menschliche Intelligenz und KI unterscheiden sich in einigen wesentlichen Aspekten. Menschliche Intelligenz zeichnet sich durch eine hohe Flexibilität und ein generelles Abstraktionsvermögen aus. KI besitzt hingegen kein generelles Abstraktionsvermögen und lässt sich jeweils nur für recht spezifische Fragestellungen anwenden. KI-Systeme können allerdings gegenüber der menschlichen Intelligenz überlegene Speicherkapazitäten aufweisen und führen formelle Aufgaben wie Rechenoperationen meist zuverlässig aus. Bei stark regelbasierten Tätigkeitsformen wie z. B. den Brettspielen Schach und Go übertreffen KI-Systeme mittlerweile menschliche Spieler:innen. Dennoch ist die formelle Informationsverarbeitung durch KI ebenfalls nicht immer fehlerfrei. Weitere wichtige Vorzüge menschlicher Intelligenz sind Empathie und Kreativität. Bekannt wurde der Begriff der KI bereits in den 1950er-Jahren durch die Vorarbeiten des Mathematikers Alan Turing. Bereits ab 1972 wurde das sogenannte MYCIN-Expert:innensystem zur Diagnose und Therapie von Infektionskrankheiten eingesetzt. Anders als moderne KI beruhten die frühen Vertreter von KI-Systemen auf rein regelbasierter Programmlogik. Das heißt, sie waren durch Daten nicht automatisch veränderbar und lernten nicht aus Feedback. Moderne KI-Systeme zeichnen sich hingegen dadurch aus, dass sie Entscheidungsregeln aus den Daten selbst ableiten können. In diesem Zusammenhang spricht man vom „Training” eines Algorithmus. Hierbei nimmt das KI-System Eingabedaten auf und identifiziert Muster und Zusammenhänge. Das Ergebnis ist ein trainiertes Modell, das in Zukunft für Vorhersagen anhand neuer Datensätze genutzt werden kann. KI lässt sich u. a. für folgende Aufgaben nutzen:
  • Vorhersagen auf Basis der ausgewerteten Daten
  • Berechnung von Wahrscheinlichkeiten für bestimmte Ereignisse
  • Erkennen von unterschiedlichen Gruppen (Clustern) in einem Datensatz
KI-Anwendungen können für Fragestellungen in zahlreichen Bereichen genutzt werden. In allen Anwendungsbereichen von KI müssen stets ethische Aspekte berücksichtigt werden. In Zusammenhang mit KI werden zahlreiche Begriffe verwendet, die ihre unterschiedlichen Teilgebiete und Technologien beschreiben. Dazu gehören u. a.: maschinelles Lernen (engl. machine learning, ML), Mustererkennung (engl. pattern recognition), Deep Learning und kognitive Systeme (engl. cognitive systems). Im Folgenden wird auf die medizinisch besonders relevanten Teilgebiete ML und Deep Learning eingegangen.

Maschinelles Lernen

ML ist ein Teilgebiet der KI. ML-Systeme generieren Wissen, indem sie selbstständig Muster und Zusammenhänge in Datensätzen erkennen. Das abgeleitete Wissen lässt sich auf neue, unbekannte Datensätze anwenden, um so Vorhersagen zu treffen und Prozesse zu optimieren. ML wird seit vielen Jahren erfolgreich in der Wirtschaft, Industrie und Forschung eingesetzt. ML-Methoden werden in überwachte (engl. supervised) und nicht überwachte (engl. unsupervised) Verfahren eingeteilt. In beiden Fällen wird aus den Daten ein „Merkmalsraum” (feature space) definiert, der die relevanten Datenattribute enthält und womit die KI letztlich lernt. Häufig verwendete ML-Methoden sind „support- vector machines” (SVM), „k-nearest neighbors” (k-NN) und „Random Forest”. Die trainierten Modelle erreichen oft eine Komplexität, bei der die Entscheidungsregeln nicht mehr transparent sind. Die Rede ist dann von sog. „Black-Box-Systemen”. Allerdings gibt es methodische Entwicklungen, die die Interpretierbarkeit von ML-Systemen verbessern, wenngleich auch hier die Entscheidungsregeln oft nicht präzise dargestellt werden können. Man spricht in solchen Fällen auch von „Gray-Box-Systemen”. Voraussetzung für einen erfolgreichen Einsatz von ML ist stets eine ausreichende Trainingsdatenbasis. Dazu müssen v. a. zwei Kriterien erfüllt sein:
  • Es besteht eine ausreichend große Datenmenge.
  • Die Daten sind qualitativ hochwertig.
Diese Voraussetzungen sind von kritischer Bedeutung. Sie sind jedoch häufig nicht einfach zu erfüllen, v. a. bei Daten aus der realen Patient:innenversorgung. Daher limitieren eine unzureichende Datenmenge und -qualität häufig die Performance von ML-Anwendungen. Neben dem Einschluss möglichst vieler Patient:innen können ML-Ergebnisse durch folgende Maßnahmen verbessert werden:
  • Standardisierung des Erhebungsverfahrens
  • Generalisierung über unterschiedlich erhobene Datensätze
  • Datenerhebung innerhalb einer möglichst repräsentativen Gruppe
Zudem müssen die Eingangsvariablen (sog. Features) zumeist vorverarbeitet werden. Dieser Prozess wird auch als Feature Engineering bezeichnet. Dazu gehören in der Regel drei grundlegende Schritte: Datenauswahl, Datenbereinigung und Datentransformation. Eine individuelle Auswertung der nicht standardisierten Datensätze ist jedoch zu vermeiden, da hierdurch ein Bias eingeführt werden kann.

Neuronale Netze und Deep Learning

Deep Learning (zu Deutsch „tiefes Lernen”) kann als Teilgebiet von ML aufgefasst werden. Das Konzept des Deep Learnings ist eng verknüpft mit sog. neuronalen Netzen (engl. „neural networks”, NN). NN bestehen aus „künstlichen Neuronen”, die Abstraktionen biologischer Neuronen darstellen und vielfach miteinander verknüpft sind. Die Struktur von NN wird „Topologie” genannt. Der Begriff Deep Learning bezeichnet den Einsatz von sehr komplexen NN mit zahlreichen Neuronen, vielschichtigen Topologien und vielen sog. verdeckten Ebenen. NN umfassen Eingangs-, Ausgangs- und dazwischenliegende „verdeckte” Neuronen. Eingangsneuronen werden durch Datenreize aktiviert, diese werden im Netz prozessiert, anschließend wird an den Ausgangsneuronen ein bestimmtes Muster aktiviert, das die Ausgabe kodiert. Das Training basiert auf Optimierungsverfahren wie der sog. Backpropagation. Der Vorteil von NN gegenüber einfacheren ML-Verfahren wie Random Forest liegt darin, dass auch sehr komplexe (hochdimensionale) Eingangsreize erfasst und verarbeitet werden können. Dazu gehören komplexe Bildinformationen wie Röntgenaufnahmen oder histologische Schnitte. Hierbei können NN auch auf viele verschiedene Zielwerte (Targets) hintrainiert werden. Anders als bei ML-Verfahren wird in der Regel kein manuelles Feature Engineering benötigt, um relevante Datenmerkmale hervorzuheben. Diese werden von NN automatisch identifiziert und aus den Rohdaten extrahiert. Die Herausforderung besteht darin, dass NN eine sehr umfangreiche Trainingsdatenmenge benötigen, um optimale Ergebnisse mit geringer Fehlerrate zu erreichen. Um das Potenzial von KI und Deep Learning voll ausschöpfen zu können, ist eine ausreichende Qualität der Inputdaten sicherzustellen und ein Daten-Bias (systematische Fehler in der Datenerhebung) zu vermeiden. Hier gilt der im Englischen bekannte Grundsatz „garbage in, garbage out” – auf Deutsch etwa „Unsinn rein (in den Computer), Unsinn raus”. NN haben sich als besonders geeignet für die Auswertung von Big Data erwiesen. Besonders erfolgreich wurden NN im Bereich der Computerlinguistik („natural language processing”) eingesetzt. In den letzten Jahren sind mit NN jedoch auch beachtliche Ergebnisse im Bereich der diagnostischen Verarbeitung von medizinischem Bildmaterial und in anderen medizinischen Bereichen erzielt worden. Diese werden im zweiten Teil dieses Kurses vorgestellt.

LITERATUR

  1. Blaschke S. Die Informationsexplosion und ihre Bewältigung: Gedanken zur Suche nach einem besseren System der Fachkommunikation. Information Wissenschaft und Praxis 2003;54:329–34
  2. Sagiroglu S, Sinanc D. Big data: A review. In: 2013 International Conference on Collaboration Technologies and Systems (CTS). IEEE 2013. 42–47
  3. Auer C et al. Künstliche Intelligenz im Gesundheitswesen. In: Gesundheit digital. Springer; Berlin Heidelberg 2019:33–46
  4. Bundesregierung 2018. Nationale Strategie für künstliche Intelligenz. https://www.kistrategie-deutschland.de/home.html; Zugriff Juni 2022
  5. Luhmann HJ. Künstliche Intelligenz – künstliches Bewusstsein. In: Hirnpotentiale.Springer; Berlin Heidelberg 2020:163–183
  6. Shortliffe E. Computer-based medical consultations: MYCIN. New York; Elsevier 1976
  7. Wuttke L. Künstliche Intelligenz verstehen und in der Organisation verankern. In: Praxisleitfaden für Künstliche Intelligenz in Marketing und Vertrieb. Springer Fachmedien; Wiesbaden 2022:55–108
  8. Kuhn M, Johnson K. A Short Tour of the Predictive Modeling Process. In: Applied Predictive Modeling. Springer; New York 2013:19–26
  9. Azodi CB et al. Opening the Black Box: Interpretable Machine Learning for Geneticists. Trends Genet 2020;36:442–455
  10. Orphanidou C, Wong D. Machine Learning Models for Multidimensional Clinical Data. Springer Nature 2017:177–216
  11. Kuhn M, Johnson K. Data Pre-processing. In: Applied Predictive Modeling. Springer; New York 2013:27–59
  12. Ching T et al. Opportunities and obstacles for deep learning in biology and medicine. J R Soc Interface 2018;15:20170387
  13. Becker K, Götz O. KI-unterstützte Anwendungen und Potenziale in der Medizin- und Gesundheitstechnologie. In: Künstliche Intelligenz im Gesundheitswesen. Springer Fachmedien; Wiesbaden 2022:593–615
  14. Esteva A et al. A guide to deep learning in healthcare. Nat Med 2019;25:24–29
  15. Liu Y et al. Deep learning and medical diagnosis. The Lancet 2019;394:1709–1710