• Frage: Gibt es Probleme bei der ki Wissenschaft

    Frage gestellt von back14pan an Elly, Christoph, Christina am 17 Jun 2022.
    • Foto: Christoph Palm

      Christoph Palm Beantwortet am 17 Jun 2022:


      Eine sehr allgemeine Frage, die ich nicht in allen Aspekten beantworten kann. Aber um mal einen Anfang zu machen:

      Eine der Herausforderungen (klingt besser als „Probleme“ 😉 ) bei der KI ist die Verfügbarkeit von Trainingsdaten in ausreichender Menge und Qualität. Ein KI-System lernt aus Daten zusammen mit der Information, was bei der Vorhersage herauskommen soll. Zumindest ist das beim häufig verwendeten überwachten Lernen so. In der Medizinischen Bildanalyse sind das z.B. Bilder, in denen ein Tumor als Kontur eingezeichnet ist. Diese Einzeichnung nennt man Annotation und wird in der Regel von einer Ärztin bzw. einem Arzt von Hand vorgenommen. Das braucht unheimlich viel Zeit, wenn man bedenkt, dass man für ein KI-System gerne einmal mehrere tausend annotierte Daten benötigt.

      Eine weitere Herausforderung ist es, dass häufig die KI-Systeme als Black-Boxen empfunden werden. Eigentlich weiß natürlich die/der Programmierer*in ganz genau, was mathematisch und programmiertechnisch bei einem KI-System angelegt ist und man kann z.B. die Parameter eines neuronalen Netzes auch abspeichern und jedem zeigen. Nur: kein Mensch versteht tatsächlich genau, was da gelernt wurde und warum genau diese Parameter zu genau dieser Vorhersage führt. Eine Ärztin/Ein Arzt möchte aber gerne nachvollziehen können, wie ein KI-System zu einer Entscheidung gekommen ist. Das ist eine Frage von Vertrauen in die Ergebnisse. Wenn ich die nachvollziehen kann, dann kann ich die auch abnicken oder eben intervenieren, wenn ich das Ergebnis für nicht plausibel halte. Es gibt zwar Ansätze der erklärbaren KI, aber von einem echten Verstehen der Vorgänge sind wir noch entfernt.

      Eine dritte Herausforderung ist die Messung der Qualität einer KI. Letztlich soll eine KI auf neuen Daten gut funktionieren und nicht unbedingt auf den Trainingsdaten. Allerdings bedeuten neue Daten oft, dass sie aus einer anderen Klinik kommen, von einem anderen Arzt mit einer anderen Kamera aufgenommen wurden. Damit trotzdem umgehen zu können, nennt man Generalisierungsfähigkeit. Aber wo fängt das an und wo hört das auf? Wenn die Testdaten sehr unterschiedlich sind, kann man fragen, ob das fair und sinnvoll ist. Wenn ich ein System trainiere, das Hund und Katzen unterscheiden kann, dann darf ich nicht meckern, dass es keine Igel erkennt.

Kommentare