• Frage: Könnten Sie mir bitte beantworten wie eine KI so erstellt wird wenn es um das Analysieren von Bildern geht

    Frage gestellt aliberl1n am 16 Jun 2022.
    • Foto: Christoph Palm

      Christoph Palm Beantwortet am 16 Jun 2022:


      Wir arbeiten mit künstlichen Neuronalen Netzen. Dabei werden die Farbwerte der Pixel eines Bildes in das Netz eingespeist und am Ende kommt eine Wahrscheinlichkeit heraus, ob in dem Bild z.B. eine Katze zu sehen ist oder nicht.

      In der Bildverarbeitung verwendet man in der Regel die Faltungsoperation, um die Farbwerte der Bilder in Merkmale umzuwandeln. Ein Merkmal, um eine Katze zu erkennen, können z.B. die Schnurrhaare oder die länge des Schwanzes sein. Erst mal geht es aber gar nicht um so komplexe Merkmale, sondern um einfache Sachen wie Ecken oder starke Farbunterschiede. So ein Farbsprung ist meistens ein Hinweis darauf, dass ein Objekt aufhört und der Hintergrund anfängt. Einen Farbsprung nennen wir „Kante“.

      Eine Faltung kannst Du Dir so vorstellen, dass sich der Computer einen kleinen Bildausschnitt ansieht, z.B. 5×5 Pixel und ein bestimmtes Merkmal überprüft, also z.B. ob sich in dem Bildausschnitt eine Ecke befindet. Wenn ja, dann wird ein hoher Wert an dieser Stelle in eine Art Merkmalsbild gespeichert, wenn nein, dann ein niedriger Wert.

      Ein neuronales Faltungsnetz zur Bildanalyse nutzt ganz viele von diesen Faltungsoperationen und lernt selbstständig, welche Art von Merkmalen für die Entscheidung am Ende wichtig sind. Diese Merkmale bauen in der Regel aufeinander auf, d.h. wenn in der ersten Schicht Ecken und Kanten erkannt worden sind, werden diese Ecken und Kanten in der zweiten Schicht zusammengesetzt usw. bis so komplexe Dinge wie die Schnurrhaare eine Katze erkannt werden können und daraus die Vorhersage, ob eine Katze im Bild ist oder nicht, hergeleitet werden kann.

      Das Lernen des Netzes funktioniert so, dass man für die Trainingsbilder weiß, was herauskommen soll und dann die Vorhersage des Netzes mit dieser „Grundwahrheit“ verglichen wird. Wenn die beiden sehr unterschiedlich sind, verändert das Netz die Faltungsoperationen, um etwas andere Merkmale zu lernen und besser zu werden.

    • Foto: Thomas Deserno

      Thomas Deserno Beantwortet am 17 Jun 2022:


      Die Bildanalyse basiert vor allem auf neuronalen Netzten (NN). Das sind Algorithmen, die durch Trainingsdaten lernen, sich so einzustellen, dass die zu einer Eingabe gewünschte Ausgabe errechnet wird. Wie in unserem Gehirn besteht das NN aus vielen knoten (Neuronen) die miteinander verbunden sind. Die Verbndung hat ein gewicht, welches im Training automatisch engestellt wird. Beispiel: Viele Bilder zeigen einen Tumor, viele Bilder keinen. Dann wird das NN so trainiert, dass es bei Tumor am Ausgang eine 1 und bei Nicht-Tumor eine 0 ausgibt. SInd erst einmal alle Gewichte eingetellt (das Training ist abgeschlossen), dann kann das Netz auch Entscheidungen für Bilder treffen, die es vrher nie gesehen hat. Das nennen wir dann KI 🙂

Kommentare