Netzgeflüster: Eine kurze Geschichte über Midjourney und karierte Hemden

Vor kurzem referierte ich schon einmal über Generative AI und werde das in absehbarer Zeit wieder tun. Da wollte ich mich doch mal auf den neusten Stand bringen und an der Reihe war das neue Lieblingstool der selbsternannten „AI Artists“: Midjourney.

Getting Started

Wer jetzt nur Bahnhof versteht: Midjourney ist ein KI-Tool, das Bilder generiert. Man gibt einen Prompt (d.h. einen Befehl) ein, der beschreibt was es generieren soll und bekommt vier Bilder zur Auswahl, die man herunterladen oder weiter als Bearbeitungsgrundlage nehmen kann. Das funktioniert über einen Bot in Discord (Chat-/Streaming-Software) und man muss sich zuvor bei Midjourney registrieren. In 5 Minuten hat man das geschafft – vorausgesetzt man hat schon Discord. Kostenfrei ist Midjourney inzwischen nicht mehr.

Gespannt war ich ja schon wie sich Generative AI inzwischen verbessert hat, wie viele Finger die Personen auf den Bildern haben würden und ob Midjourney in punkto längst viel diskutiertem inbegriffenem Bias gelernt hat.

Terms of Service und so

Neben den Kosten (aktuell 8-11$ monatlich aufwärts) war ich auch sehr gespannt auf die Nutzungsbedingungen. Obwohl Midjourney wie andere Generative AI auf u.a. Bildern aus dem Internet trainiert wurde (deren Urheber:innen vielleicht nicht zwingend zugestimmt haben? Wer weiß das?), verspricht es uns dort komplette Rechte an den generierten Inhalten und behält natürlich selbst Nutzungsrechte ein. Immerhin: es gibt eine Takedown Policy. Wenn man also der Meinung ist lizenzrechtlich geschütztes Material gefunden zu haben, dann kann man das melden. Das ist ja schön, aber wie erkenne ich das im generierten Bild? Oder weise das eindeutig nach? 🤔

Mit dem leicht verständlichen Quick Start Guide kommt man dann sehr schnell zu Ergebnissen. Was ich gut finde ist der Code of Conduct darin. Schließlich sehen zig andere User im Discord Chat, was man da generiert. Ich möchte dort keinen Erwachsenen-Content, mysogynen Quatsch oder brutalen Mist sehen. Das macht der Code of Conduct deutlich. Was ich sehe und was andere generieren sind viel harmlose Spielereien. Natürlich zeichnen sich einige Trends ab. Schöne Landschaftsbilder. Bilder, die als Werbematerial herhalten könnten. Spielereien um Lieblings-Anime-Charaktere. Und Frauen in engen Superhelden-Kostümen. 🤨

Hat es mich schon abgeschafft?

Am gespanntesten war ich, ob es Bilder wie ich sie mal gezeichnet habe nun inzwischen auch generieren kann und mich als Semi-professionelle-Teilzeit-Illustratorin inzwischen abgeschafft hat. Vielleicht erinnert ihr euch, das ich das schon mal ausprobiert habe und mit dem Ergebnis nicht zufrieden war, ergo meinen Seelenfrieden behielt und glücklich weiterzeichnen konnte. 😌 Als Beispiel nahm ich wieder das Logo, das ich vor einer Weile für Sandra und ihren Blog Booknapping gestaltet habe. Es sollte Sandras Maskottchen Assel zeigen. Mein Ergebnis kann man entweder bei Sandra sehen oder in meinem Kunstblog. Lasst es mich so formulieren: Assel besticht durch den angenehm entspannten Blick.

Natürlich habe ich nicht unter einem Stein gelebt und wusste, dass schon was ansehnliches rauskommen würde. Aber wie viel müsste ich tweaken, damit es aussieht wie die Assel? Ich habe es also mit Prompts wie „cute woodlouse in style of manga“ (1. Bild), „woodlouse in a handdrawn manga style, coloured“ (2. Bild) oder „cute woodlouse in a handdrawn manga style, coloured, with a melancholic sleepy look on its face“ (3. Bild) probiert und die Ergebnisse sind tatsächlich sehr hübsch, aber irgendwie nicht so auf den Punkt. Was soll man sagen.

Es gibt inzwischen Modi in denen man auf Grundlage von hochgeladenen Bildern experimentieren kann. Vielleicht versuche ich das nochmal. Probiert habe ich eine ganze Menge, auch auf Deutsch und mit diversen Parametern. Aber so sehr viel anders wurde die Assel nicht. Vielleicht muss ich noch üben. Vielleicht zeichne ich in der Zeit auch einfach was. Vielleicht behalte ich auch einfach meinen Seelenfrieden . 😉 Und dann war da ja noch der andere Test…

Spielen mit viel Humor

Vor einer Weile hat ein Arbeitskollege live Bilder von Softwareentwicklern generiert und es kamen nur weiße, bärtige Männer raus. Wie viel besser sind Bildgeneratoren denn nun geworden? Nun, es ist schon besser geworden. Immerhin kamen mal verschiedene Typen Mann raus. Aber es waren immer Männer bei Prompts wie „realistic photo of a software developer hacking some code“ (1. Bild) oder „realistic photo of a java software developer fixing a build pipeline“ (2. & 3. Bild). Dank Midjourney weiß ich also nun, dass Entwickelnde alle Männer sind und die bevorzugt karierte Hemden tragen oder Hoodies. Wie das gängige Vorurteil von vor zehn Jahren. Schön, dass ich der lebende Gegenbeweis bin. So als Frau, die Softwareentwicklerin ist und kein kariertes Hemd im Schrank hat … 🤨 Dafür aber einige Hoodies. Die (nicht vorhandene) Geschlechterverteilung erregt aber eher mein Ärgernis als der implizierte Dresscode. Wenn ich zu wütend werde, erfreue ich mich an dem Bild mit dem Pailletten-Visier (???) oder was auch immer das darstellen soll und dem offensichtlich transparentem Laser-Display in Matrix-Style… .

Aber Frauen kann es. Jedenfalls wenn ich den „female software developer“ per Prompt direkt fordere. Nur beruhigt mich das nur mäßig, weil ich es fordern muss. Zumindest im genderneutralen Englischen hatte ich da was anderes erwartet. Spannend wäre nun zu wissen, ob das ein Problem des Foundation Models ist, dass die textuellen Spracheingaben verarbeitet oder eines des Netzes, dass die Bilder generiert.

Das mit dem Humor ist auch noch so eine Sache. Als ich „realistic photo of a software developer fixing a burning pipeline“ forderte, hat es das sehr wörtlich genommen. 😅 Zumindest ist das erheiternd.

Naja, wie zu erwarten ist der Geist in der Maschine noch sehr geisterhaft. Was sind eure bisherigen Erfahrungen mit Generative AI? Wo erleichtert sie euch das Leben, wo nicht? Ich gestehe: bis jetzt dauert das Formulieren der Prompts länger als wenn ich es selber schreibe (falls ich mir Coding-Beispiele generieren lassen will). Und die Bilder sind beeindruckend schön, aber in der Regel nicht das was ich gesucht habe.

Netzgeflüster ist eine Kategorie meines Blogs in der ich mich immer zwischen dem 10. und 15. eines jedes Monats Themen aus IT, Forschung, Netzwelt und Internet widme genauso wie Spaß rund um die Arbeit mit Bits und Bytes. 😉

Eine Antwort

  1. Bei KI, die im kreativen Bereich eingesetzt wird, habe ich ein ganz übles Gefühl und finde schon die Versuche, die einige jetzt aus purer Neugier damit starten, gar nicht gut – da sie dieses Medium noch zusätzlich befeuern. Weshalb ich mich weigere, Chat GPT und Midjourney auszuprobieren, auch nicht „just for fun“.

    Ganz abgesehen davon, dass ich das Gefühl habe, dass diesen Bildchen die Seele fehlt.

    Bedenklich wird die Sache für mich dann, wenn Autoren, die wie ich auf der Schreibplattform wattpad ihre Bücher schreiben, nur noch auf Midjourney zurückgreifen, um ansprechende Cover zu erstellen. Denn dadurch werden solche Bücher vermehrt angeklickt, weil die Leser denken, ihr Inhalt wäre genauso genial wie die Verpackung – wodurch diese Werke im Ranking immer weiter nach oben rutschen.

    Während „handgemachtes“ da nur selten mithalten kann. Da frage ich mich allen Ernstes: Was kommt als nächstes? Ganze Bücher nur mit einer KI erstellt?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert