Kolumne

#brodnig: Gib mir die Hand

Künstliche Intelligenz ist auffallend schlecht darin, Hände darzustellen - das lehrt uns einiges.

Drucken

Schriftgröße

Wenn Sie sich ein bisschen gruseln wollen, habe ich folgende Empfehlung: Im Internet kann man künstliche Intelligenz (KI) ausprobieren, die Bilder nach Wunsch erstellt. Viele der erzeugten Abbildungen schauen beeindruckend aus. Man sieht eine Zeichnung von Micky Maus, der auf einer Wolke sitzt, oder das Foto einer modern eingerichteten Wohnung, welche die KI zur Gänze erfunden hat. Doch menschliche Hände scheinen eine Herausforderung für diese Software zu sein. Ich habe zum Beispiel die Anwendung Stable Diffusion darum gebeten, "human hands on a smartphone" zu zeichnen. Das Ergebnis ist creepy. Zum Teil sind die Finger verbogen oder viel zu kurz (siehe Foto).Auf einem Bild lässt sich erahnen, dass die Hand sechs Finger hat. Ähnliche Ergebnisse erzeugte die Software Midjourney. Diese bat ich, "human hands on a keyboard" zu zeichnen. Sie zeigte mir alptraumhafte Fotos von verformten Händen-teils mit sechs Fingern, teils mit Nägeln an der falschen Stelle. Das Online-Medium "Buzzfeed" hat mittlerweile sogar einen Artikel zur Frage veröffentlicht, weshalb künstliche Intelligenz Hände so schlecht darstellt. 

Eine Erklärung ist: Programme dieser Art werden mit großen Mengen von Daten (also vielen Bildern) trainiert. In den genutzten Fotos sind Hände aber oft nur ein kleines Detail. Womöglich fehlten Trainingsdaten, also Bildmaterial, das Hände als Ganzes zeigt. Außerdem sind Hände komplex. Sie sehen anders aus, je nachdem, ob man etwas hält oder ob man eine Faust beziehungsweise eine Geste mit den Fingern macht. Die Software weiß nicht wirklich, wie menschliche Körperteile im Regelfall aussehen, sie ahmt lediglich Muster nach, die sie auf anderen Fotos erkannt hat. Man kann damit rechnen, dass derartige KI (auch mithilfe weiterer Trainingsdaten) dazulernt und klüger darin wird, Körperteile anatomisch korrekt darzustellen. Schon jetzt sehen viele von künstlicher Intelligenz geschaffene Bilder beeindruckend und überzeugend echt aus. Diese gruseligen Bilder von misslungenen Händen zeigen aber: Die Software ist insofern unintelligent, als sie kein wirkliches Verständnis von dem hat, was sie zeichnet. Ein Verständnis des Bildes bringt erst der Mensch mit, wenn er oder sie es betrachtet und mit dem eigenen (im Gegensatz zur Software vorhandenen) Wissen über die Welt einordnet.

Was denken Sie darüber? Schreiben Sie mir unter [email protected] 

facebook.com/brodnig

twitter.com/brodnig

Ingrid   Brodnig

Ingrid Brodnig

war bis Dezember 2023 Kolumnistin des Nachrichtenmagazin profil. Ihr Schwerpunkt ist die Digitalisierung und wie sich diese auf uns alle auswirkt.