Gedichte mit Künstlicher Intelligenz visualisieren

Zuletzt bearbeitet am 6. 12 2023 von Lenny Löwenstern

Chat GPT und DALL-E im Zusammenspiel

Seit einiger Zeit veröffentliche ich hier auch Visualisierungen meiner Gedichte, die von künstlicher Intelligenz angefertigt wurden. Das ist für mich ein neuer Ansatz. Meine eigenen Grafiken waren nie mehr als Rahmen oder Kulissen, die ein Gedicht in Szene setzen sollten. Es war ja selbst auch immer Bestandteil des Bildes. Jetzt hingegen wird der Inhalt selbst in ein Bild transformiert.

Nun stellen Leser die Frage: Wie funktioniert das? Die Antwort ist überraschend einfach, und jeder kann es machen.

Alles, was ich dazu angeschafft habe, ist ein Account bei OpenAI. Das ist die Firma, die Chat GPT, die derzeit bekannteste KI, und die Bilder KI DALL-E entwickelt hat. Das Abo kostet 20 Dollar im Monat. Ich bin Autor von Roman, Sachbücher und Online Texte, für mich ist das Gold wert, ein besseres Textwerkzeug hat es nie gegeben. Man kann die beiden aber auch kostenlos benutzen.

DALL-E lässt sich auch von der Suchmaschine Bing aus verwenden. Das ist kostenlos, aber du brauchst ein Microsoft-Konto. Es gibt einen Nachteil: Was Bing herausrückt, das ist bereits ein komprimiertes JPG. Es wird dadurch schwieriger Bilder nachzubearbeiten, etwa wenn man andere Größen braucht oder Text retuschieren will.

OpenAI hat eine Schnittstelle (ein GPT) eingerichtet, die dafür sorgt, dass die beiden KIs zusammenspielen. Ich tue also wirklich nichts anderes, als ein Gedicht bei ChatGPT einzugeben und ihm zu sagen, dass er es visualisieren möge. Er übersetzt den Text ins Englische und formt einen so genannten Prompt daraus, das ist Anweisung für die Bild KI, die aus Keywords besteht. Mehr ist es nicht.

Man kann das Verfeinern, beispielsweise kann man Angaben zum Bildformat machen: Hochformat (1024*1792 Pixel) oder Breitformat (1792*1024 Pixel). Von Haus aus nutzt DALL-E ein Quadrat, ähnlich dem häufig auf Instagram verwendeten Format, das ich hier vorher auch schon verwendet habe. Man kann Einfluss nehmen auf den Stil, die Farben und so weiter. Die Ergebnisse kommen als PNG.

Aber all das interessiert mich nur teilweise, weil ich sehen möchte, was die KI aus meinen Gedichten macht. Manchmal verblüfft sie mich. Hin und wieder sind die Ergebnisse langweilig, zu ähnlich oder gänzlich misslungen. Das mag an meinen Gedichte liegen … Im Zweifel probiert man es eben mehrmals hintereinander. Wer will, beschreibt sein Wunschbild, auch das kann zum Ziel führen.

Die Ergebnisse sind nicht zufällig, das erkennt man sofort. Es sind eben keine willkürlichen, abstrakten Kompositionen, sondern es wirkt, als hätte sich jemand tatsächlich über den Inhalt Gedanken gemacht. Ja, als würde die KI verstehen, worum es geht.

Gedicht Visualisierung

Regen Regen
den Mond verwaschen
Engel in Pfützen
kein Himmel mehr

Ausschnitt aus dem Gedicht: Blau geht gar nicht mehr | 1

Wichtig zu wissen ist, es kommt immer etwas anderes heraus. DALL-E malt nie zweimal dasselbe Bild, ChatGPT schreibt niemals denselben Text. Denn beide sind generative Modelle, sie nutzen keine vordefinierten Muster oder Datenbanken, sondern erstellen alles immer live. Die Bilder können bei gleicher Anfrage etwas völlig anderes zeigen und dennoch beim Thema sein.

Nicht selten mischt die KI Buchstaben und Pseudotexte in ihre Bilder, das macht sie unbrau chbar, denn meistens sieht es fürchterlich und fehlerhaft aus, da keine echte Sprache zu sehen ist. Dann muss man von vorn beginnen, bekommt aber ein garantiert anderes Ergebnis. Oder man setzt ein Werkzeug wie Photoshop ein. Je nachdem, wo der Text auftaucht, kann man ihn entfernen oder wegradieren.

Wie funktioniert das?

DALL-E basiert auf einer großen Menge an Bild- und Textdaten, mit denen es trainiert wurde. Dieses Training ermöglicht es der KI, Zusammenhänge zwischen Textbeschreibungen und visuellen Elementen zu verstehen. Wenn ein Benutzer eine Textanweisung eingibt, analysiert DALL-E diese Anweisung und generiert ein Bild, das den beschriebenen Inhalten entspricht. Durch die Verwendung von Algorithmen kann DALL-E eine Vielzahl von Bildstilen und -inhalten erzeugen, von realistischen Darstellungen bis hin zu abstrakten Kunstwerken.

Und wie lange dauert das? Eigentlich nur Sekunden, aber die Dateien sind nicht Ladezeitoptimiert, was ihre Ausgabe verzögert. Außerderm kämpft der Anbieter mit Kapazitätsproblemen. Trägt man zu viele Wünsche an das System heran, verweigert es die Zusammenarbeit, vergibt Termine oder lässt Fehlermeldungen sehen. Dann heißt es warten.

Vielfältige Ergebnisse

Was herauskommt kann völlig anders ausssehen, als die visualisierten Texte, die ich auf anderswwwo zeige, von denen übrigens kein einziges nachbearbeitet ist. Hier ist ein Beispiel eines anderen Kalibers.

O du süßer Sommersonnentag,
liebedurchdrungener Wonnentag.
So wie die Rose mir den Tag versüßt,
Hat der Sommer still ihr Herz geküsst.

Friedrich von Weißenfels: Die Rosen vor den Toren des Sommers

Probieren wir es aus: Visualisiere dieses Gedicht:

KI generierte Version eines Rosengedichts

Hier ist ein Gedicht von Rilke. Das grafische Ergebnis hat etwas Unheimliches an sich, wie ich finde.

Tausend Tränen reden
ewig ungestillt, – –
und in einer jeden
spiegelt sich dein Bild.

Nachtgedanken, 1894
KI Visualisierung eines Rilke Gedichts

ChatGPT akzeptiert nicht jeden Text. Es gibt Zensurfilter. Böse Sprache, fiese Begriffe, Sexualität, all das wird nicht akzeptiert. Ein Teil der Texte bleibt also außen vor. Ärgerlicherweise geht die KI deutlich über ein nötiges Mindestmaß hinaus.

Das dritte Beispiel stammt von Friedrich Rückert. Er schreibt gänzlich anders, so fällt auch das Ergebnis der Visualisierung aus:

Den voll Scherzmut
Schwärmenden
Frühlingsrosentag,
Kaltes Herzblut
Wärmenden
Lebensfunkenschlag,
Schenke, gib mir den roten!
Kalt sind die Toten,
Wie ich nicht werden mag.

Friedrich Rückert, entnommen aus “Scherzhafte Trinkreime”.
KI Visualisierung eines Rückert Gedichts

Und wie ist das mit den Copyrights der Bilder?

OpenAI sagt dazu: “As with DALL·E 2, the images you create with DALL·E 3 are yours to use and you don’t need our permission to reprint, sell or merchandise them.” Übersetzt: “Wie bei DALL·E 2 gehören die Bilder, die du mit DALL·E 3 erstellst, dir und du brauchst unsere Erlaubnis nicht, um sie nachzudrucken, zu verkaufen oder zu vermarkten.”

Stelle gern Fragen zum Artikel oder berichte von deinen eigenen Erfahrung. KI ist ein neues, faszinierendes Gebiet, das es erst noch auszuloten gilt. Ich bin sehr gespannt, was wir entdecken werden.

2 Gedanken zu „Gedichte mit Künstlicher Intelligenz visualisieren“

  1. Hallo Lenny Löwenstern.
    Bekam heute zum ersten Mal deinen Newsletter. Bin entzückt über deine Wortschätze. Mit Worten Bilder malen, das musste der Künstler früher selber machen. Durch den Funken der Poesie, der in ihm glomm. Das erledigt die KI jetzt auch für uns. Ich gestehe, die Bilder, die der Rechner erzeugt sind, faszinierend und zu allem Übel auch noch inspirierend. Und es hat eben erst angefangen. Wird der Mensch bald überflüssig. Nun denn…🙂

    Antworten
  2. Hallo Gunter,

    danke für deinen Besuch hier! Ja, es ist erstaunlich, was man alles machen kann. Das dehnt sich jetzt schon über viele Gebiete aus. Und das geht noch weiter. Genau, es hat gerade erst angefangen.
    Ich denke, viele Menschen werden sich schon bald einen neuen Sinn für ihr Leben suchen müssen. Geistige Arbeit wird nicht mehr gefragt sein.

    Antworten

Schreibe einen Kommentar