The Witcher und das Problem mit AI Imaging

Ist das jetzt mehr Netzgeflüster oder mehr Serien-Talk? Entscheiden konnte ich mich nicht, also ist es beides. Konkret geht es um ein Video, über das ich auf Youtube gestolpert bin. Es hat angeblich Beschreibungen der Witcher-Charaktere in Midjourney, einen AI-Image-Generator, gespeist und absolut verblüffende ✨ Ergebnisse zurückbekommen, die entlarven, dass … ja schaut selber. Ich bin gespannt, ob euch was auffällt. 😉

Das Video

Leider kann ich das Video nicht einbetten, da die Inhaber die Funktion ausgeschalten haben bzw. es nicht erlauben. Ihr könnt das Video unter dem nachfolgenden Link finden: AI Portrays Book Descriptions of The Witcher Characters, es wurde am 28.06.23 hochgeladen und stammt vom Youtube-Kanal „AI Overlords“.

Die Befunde

Ich bin gespannt, was euch zuerst aufgefallen ist. Mir sprang es spätestens bei Fringilla entgegen, dass alle Charaktere weiß aus Midjourney rauskommen. Dann fragte ich mich, was sie denn in den Image Generator für Prompts eingegeben haben und dass das Video das nicht erkennen lässt. Sie geben zwar in der Beschreibung des Videos an, dass sie die Textauszüge aus den Romanen Andrzej Sapkowskis benutzen, aber die Texte selber bleiben uns verwehrt.

„Welcome to AI Portrays The Witcher Characters, where we employ the AI tool Midjourney and character descriptions from Andrzej Sapkowski’s The Witcher saga to paint vivid pictures of their appearances throughout the epic journey.“

AI Portrays Book Descriptions of The Witcher Characters vom 28.06.23 aus dem Youtube-Kanal „AI Overlords“

Auch die Prompts geben sie nicht mit an. Dadurch sind wir immer noch nicht schlauer, ob Sapkowski die Charaktere wirklich als durchgängig weiß beschrieben hat oder ob die verwendeten Prompts vorschreiben, dass Bilder weißer Personen generiert werden sollen. Wenn Midjourney lediglich Sapkowskis Texte ohne Angaben wie „porzellanweißer Teint“ hatte, dann ist es ein im Modell der AI versteckter Rassismus, der vielleicht auf bereits einseitiger Datengrundlage und Statistik fußt. Es assoziiert dann „Mensch“ automatisch mit „weißer Mensch“, was tragisch, unfair und nicht korrekt wäre.

Wenn ihr zu der Fraktion gehört, die sagt „Sapkowski geht vom polnischen Mittelalter aus, da gab es nur weiße Personen!“ dann können wir uns auch an anderen Problemen langhangeln. Zum Beispiel, dass alle Personen auf den Bildern unfassbar schön sind, unfassbar gleichmäßige, weichgezeichnete Haut haben und unfassbar saubere Klamotten und Frisuren, die aussehen wie aus Modezeitschriften. Die Gesichter ähneln anderen Prominenten wie Angelina Jolie. Passt das noch zur Vorstellung vom Mittelalter?

Der Debatte stimme ich eh nicht zu. Es ist Fantasy – warum sollte es darauf beschränkt werden wie die Realität des polnischen Mittelalters zu sein? Da hüpfen auch Elfen drin rum und Geralt hat sehr seltsame Augen. (Pun intended.) Darüber habe ich schon in einem anderen Beitrag ein deutliches Statement dagelassen. Repräsentation ist wichtig und Fantasy hat alle Möglichkeiten das umzusetzen. Was nicht ins Bild passt ist meistens nur der eigene Bias.

Das Problem

Aus Sicht von Serienfans lässt das wieder tief blicken und eröffnet drei, vier müde machende Debatten. Schaut man in die Kommentare unter dem Video, dann heißt es dort, dass die Charaktere soviel besser getroffen sind als es die Netflixserie tut. Dass der einzige Charakter, der in der Serie aussieht wie im Buch beschrieben Henry Cavill sei. Dass Henry Cavill das eeeiiinziiige ist, was an der Serie funktioniert. Uff. Ich habe nicht weit genug gelesen, ob auch irgendwer die generierten Bilder hinterfragt oder gemerkt hat, dass die Beschreibungen aus den Büchern und Prompts fehlen und damit nichts an dem Video aussagekräftig ist. Die Urheber:innen des Videos könnten einfach Midjourney instruiert haben sie so zu rendern wie sie selber die Charaktere interpretieren. Oder solange weitergemacht haben bis eins Cavill ähnelte. Es ist alles so intransparent und die Serien-Debatten bin ich leid. Davon, dass eine Adaption nie das Quellmaterial treffen kann und vielleicht auch nicht muss, fange ich gar nicht erst an.

Ich will die Urheber:innen des Videos gar nicht als verantwortungslos darstellen, aber sagen wir mal so: ich hätte Feedback was sie anders machen könnten. Man sieht an den Kommentaren ja was das verursacht. Es ist sicherlich gut sich an die Regeln zu halten, die Constanze Kurz und Debora Weber-Wulff neulich für und auf Netzpolitik.org aufgestellt haben. Dort heißt es:

„Zu einer ethischen Verwendung von einem KI-System gehören nur drei einfache Regeln:

  1. Täusche nicht vor. Es sollte explizit erlaubt sein, ein KI-System einzusetzen, also gerade nicht bei eigenhändigen Aufsätzen im Bildungszusammenhang oder als „Co-Autor“ eines wissenschaftlichen Aufsatzes.
  2. Zeige es an. Es sollte transparent dargestellt werden, wo genau und zu welchem Zweck welche Version von welchem KI-System eingesetzt wurde.
  3. Stehe dazu. Übernimm die volle Verantwortung für jeglichen Mist, den das System produziert. Keine Ausreden.“
Maschinelles Lernen: Nicht so brillant wie von manchen erhofft von Constanze Kurz und Debora Weber-Wulff am 21.08.2023 auf Netzpolitik.org

Gerade wenn damit geworben wird, dass die generierten Bildern nicht nur Schmuck sind, sondern zu einem Sachverhalt beitragen sollen, dann würde ich gern um eine vierte Regel ergänzen bzw. die zweite erweitern:

4. Gib an, welche Prompts bzw. welcher Input für die Generierung genutzt wurde. Es fördert Verständnis unter welchen Gesichtspunkten der Bildgenerator zu genau diesem Ergebnis kam und hilft der Einordnung.

C’est moi.

Warum so genau sein? Naja, wem sich bis jetzt nicht schon bei Bildgeneratoren die Zehennägel nach oben rollen, diejenigen sollten mal schauen, was für Kreationen der Youtube-Kanal noch präsentiert: The Real Faces Of Legendary Warriors Through the Eyes of AI. Dort wird nicht gesagt, dass Julius Caesar so ausgesehen haben könnte, sondern suggeriert man zeige „reale Gesichter“. Das Problem ist, dass das nicht als „Entertainment“ oder „Rumspielen“ erkannt wird, sondern von manchen möglicherweise als Fakten.

Was sind eure Gedanken dazu? Empfindet ihr bei dem Video auch eher Cringe oder findet ihrs eigentlich ganz schön, was da rausgekommen ist? Oder beides? Wo enttäuschen euch AI-Bildgeneratoren? Wo nicht?

Eine Antwort

  1. […] Watch untersucht wie die mit Vielfalt umgehen. Sind KI-Modelle wirklich inzwischen soweit, dass ein Prompt auch Personen unterschiedlicher Hautfarbe etc. generieren kann statt beispielsweise vorrangig weiße Menschen? Oder vorrangig schöne? Sonst irgendwelche […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert