Was zeichnet visuelles Storytelling mit KI aus? Dazu befragte ich Stefanie Krüll, Grafikdesignerin und Expertin für künstliche Bildgenerierung mit Midjourney, Flux, Ideogram und Co. In unserem Interview geht es um Tools und Techniken, um Trends, Kreativität, Ethik, um Fake, Faszination, Early Adopter. Und um einen spannenden Lebenslauf in einer Welt der Bilder, die sich gerade neu erfindet.

Seit wann arbeitest du mit KI?

Ich hatte im Frühsommer 2022 das erste Mal von Midjourney gehört und es aufgrund der für mich eher unästhetisch wirkenden Ergebnisse erst einmal sträflich ignoriert. Richtig eingestiegen in visuelles Storytelling mit KI bin ich dann im Spätsommer 2022, als die Ergebnisse schon deutlich besser wurden und ich für mich das Potenzial dieser neuen Technik erkannt habe.

Stefanie Krüll: Grafikdesignerin und Expertin für künstliche Bildgenerierung mit KI-Tools

Stefanie Krüll: Grafikdesignerin und Expertin für künstliche Bildgenerierung mit KI-Tools

Was fasziniert dich am visuellen Storytelling mit KI?

Die Faszination liegt erst einmal darin, dass das, was ich mir in meinem Kopf bzw. meiner Vorstellungskraft so alles ausmale, plötzlich durch einen ganz neuen Kanal visualisieren kann. Nämlich nur durch eine Texteingabe (Prompt).

Hinzu kommt dann die Schnelligkeit, mit der ich meine Kreativität ausleben kann, da die Bilder in wenigen Sekunden generiert werden.

Außerdem kann ich die generierten Bilder in Bewegung bringen und kleine Videosequenzen erstellen, die dann wunderbar als Video auf Social Media funktionieren – somit wird das Storytelling quasi »zum Leben erweckt«.

Vorstellungen in wenigen Sekunden zu Bildern werden lassen

Magst du deinen Weg, deine Erfahrungsgeschichte mit KI etwas genauer beschreiben? Was hast du erlebt?

Rein aus intrinsischer Motivation heraus bin ich in das Thema der Künstlichen Bildgenerierung eingestiegen. Diese Leidenschaft hat mich sehr schnell an den Startplatz Köln gebracht – und zur Teilnahme an der AI Summer School. Ich bin bis heute dem Gründer des Startsplatz, Lorenz Gräf, sehr dankbar, denn er hat mich damals gefragt, ob ich nicht mal einen Midjourney Workshop oder Vortrag halten möchte.

Als Early Adopter für visuelles Storytelling mit KI habe ich parallel begonnen, auf Linkedin über Midjourney und weitere Tools zu berichten – und plötzlich kamen auch darüber die ersten Workshop-Anfragen von Unternehmen und Agenturen. Zusätzlich habe ich Vorträge über die »Künstliche Bildgenerierung im Marketing« oder auch in Bezug auf »KI und Ethik« gehalten, u.a. vor dem Ethikverband der deutschen Wirtschaft e.V.

Bis heute kommen übrigens die meisten Buchungen über Linkedin oder Mundpropanda.

Das geht alles sehr schnell.

Allerdings. Ich hatte Glück, früh in das Thema eingestiegen zu sein. Und es fasziniert mich bis heute.

Mein Highlight für 2025 ist mein Impulsvortrag auf der »Rise of AI« in Berlin. Dort war ich 2024 zum ersten Mal als Gast – ein Jahr später werde ich selbst auf der Bühne stehen.

Unglaublich dankbar bin ich übrigens für all die tollen Menschen und Begegnungen, die ich auf meinem KI-Weg bisher hatte. Hier möchte ich besonders Christian Bornmann erwähnen, der mich im Oktober 2023 in einer 5-minütigen Brandrede davon überzeugte, mit ihm und fünf weiteren Männern den Kölner KI-Verein GMKI – Gemeinsam mit Künstlicher Intelligenz zu gründen.

Klar bin ich eingestiegen. Als Quotenfrau sozusagen. Im Ernst: Diese Arbeit und der Austausch machen so viel Spaß und ich lerne so viel dazu.

Wir veranstalten Prompt Challenges, Info- und Themenabende, Tool-Testing-Abende, Schulworkshops, Stammtische und demnächst unsere erste Podiumsdiskussion. Das ist auch ein Meilenstein auf meinem KI-Weg.

Für Lacher sorgt Trump als Fünfjähriger

Auf welche Kreationen mit KI bist du besonders stolz? Warum?

Stolz? Das Wort mag ich gar nicht so sehr. Ich freue mich aber z.B. sehr darüber, dass ich diesen beruflichen Shift so knallhart durchgezogen habe. Denn das ist echt schon ganz schön anstrengend.

Erstens in meinem Alter, zweitens aufgrund der Schnelligkeit, in der die ganzen Tools auf den Markt kommen.

Aber um die Frage zu beantworten: Ich arbeite ja meistens in Serien und ich mag z.B. meine »Ballet Animals«, die »Fashion Monochromes«, die »Glossy Weird World«, die »Geometry Fashion« und die »Dada Fashion« Serien sehr. An denen hänge ich besonders.

Fashion Monochromes

Fashion Monochromes

Geometry Fashion

Geometry Fashion

Dada Fashion

Dada Fashion

Für große Lacher sorgen auch immer noch die »Famous Kids«, wo wir einen 5-jährigen Amerikanischen Präsidenten schon mit roter Krawatte sehen oder den 3-jährigen Boris Johnson mit Sturmfrisur.

Besonders spannend finde ich auch meine Idee, eine englische Bildunterschrift eines Nubischen Kriegers (gesehen in einem Museum) 1:1 zu kopieren und zu prompten – mit beeindruckenden Ergebnissen in weiteren Iterationen. Und das alles im Urlaub auf dem Handy, sozusagen im Vorbeigehen.

Vom Museum direkt in die Zukunft

Wie bist du dabei vorgegangen?

Der Workflow war recht simpel. Vier Schritte:

  1. Ich habe ein Foto der Bildunterschrift gemacht
  2. Dieses in Chatty (ChatGPT) eingegeben mit der Bitte, mir den Text zu extrahieren
  3. Den Text kopiert und dann
  4. In Midjourney mit dem einzigen Zusatz »a photo of« reingegeben

In weiteren Iterationen habe ich mehr Farbe und einen futuristischen Touch reingepromptet. Sah ziemlich cool aus! Hach … und genau dafür lieb ich das einfach alles!

Die Bilder zeigen zuerst die drei naturalistischen Generierungen analog zum Ursprungsprompt. Und dann die Frauen mit dem farbigen, futuristischen Look durch meinem modifizierten Prompt

Welches Feedback bekommst du zu deinen Kreationen von Freundinnen, Kollegen, Kundinnen?

Ich höre immer mal wieder sowas wie, dass ich eben eher »Kunst mache als nur irgendwelche KI-Bilder«. Die meisten finden meine Bilder sehr ästhetisch und schlagen mir deshalb vor, mal ein Coffeetable Book zu machen oder einen Kalender. Die Idee mit einem Wandkalender finde ich nicht schlecht. Vielleicht gibt das ja noch was vor Weihnachten.

Deutlich gestiegene Nachfrage nach Upskilling von Solopreneuren, Marketingabteilungen oder Kreativunits

Wie offen sind Kunden für den Einsatz von KI im Marketing?

Ich beobachte eine stetige Zunahme des Einsatzes von KI generierten Inhalten im Marketing – und zwar in allen Bereichen wie Text, Bild, Video, Musik, Recherche etc. Deshalb werde ich ja z.B. auch für Workshops gebucht. Man merkt eine deutliche Nachfrage nach Upskilling von Solopreneuren, Marketingabteilungen oder Kreativunits.

Was wird als Vorteil bewertet? Und wo sind die Kritikpunkte an visuellem Storytelling mit KI?

Die Vorteile liegen auf der Hand:

  1. eigene (besonders auch verrückte) Ideen visualisieren + Kreativität ausleben
  2. Personalisierung
  3. Flexibilität
  4. Kostenersparnis
  5. Zeitersparnis
  6. ingesamt also eine höhere Effizienz

Die Nachteile wären:

  1. Oft generischer Look (z.B. DALL-E 3 Bilder) Hier muss ich sagen, dass die Bildästhetik wirklich nicht so toll ist. Ich sehe immer noch in vielen Präsentationen diese Bilder. Ich verstehe das nicht. Es gibt so tolle Tools, die eine ganz andere Bildsprache zaubern – und dann greift man zum einfachsten Mittel. Da schalte ich persönlich schon ab.
  2. Fehlerhafte Umsetzungen (gerade bei echten Locations aufpassen!)
  3. Verlust von Authentizität

Das Urheberrecht muss überarbeitet werden

Thema Copyright. Wie könnte man sicherstellen, dass die Rechte von Fotografen und Künstlern respektiert werden?

Bei den Marktführern sind die Daten eingelesen und die KI wurde damit trainiert. Der Zug ist erst einmal abgefahren. Dass das alles ohne Erlaubnis und Zustimmung passiert ist, finde ich nicht richtig – insbesondere, weil die Künstler:innen in keiner Form vergütet werden, die großen Unternehmen aber richtig viel Geld damit verdienen.

So ein Vergütungsmodell oder auch Kollektivlizenzen, wo Urheber:innen ihr Werke gezielt zum Training freigeben, finde ich eine gute Idee, um einen Ausgleich zu schaffen.

Die Unternehmen sollten zudem offenlegen, welche Bilddaten für das Training ihrer KI-Modelle verwendet wurden und parallel dazu sollen KI-Bilder klar als solche gekennzeichnet werden.

Und schließlich wird das Urheberrecht überarbeitet werden müssen, um die KI-generierten Inhalte von den echten zu trennen und somit das Urheberrecht im KI-Zeitalter zu schützen.

Noch lassen sich Fake-Bilder von realen Bildern unterscheiden

Thema Fake. Lassen sich KI-generierte Bilder noch von echten Bildern unterschieden? Wenn ja: wie? 

Also, noch – die Betonung liegt auf NOCH – kann man es meistens an einigen Merkmalen sehen, dass es sich um ein generiertes Bild handelt. Und ich rede hier von wirklich guten Tools wie Midjourney oder Flux, die schon sehr fotorealistisch generieren können; bei DALL-E3, welches z.B. in ChatGPT generiert, erkennt man immer noch sofort, dass es kein echtes Foto ist.

Darauf ist zu achten:

  1. Hände kontrollieren (gerne 3 oder 6 Finger)
  2. Pupillen checken
  3. Viele Personen im Hintergrund: manchmal gleiche Gesichter oder unscharf, ungenau
  4. Bei Mustern schauen, ob die sich logisch fortsetzen
  5. Schatten und Licht überprüfen
  6. Vordergrundschärfe und Tiefenunschärfe checken
  7. Die Haut anschauen: Oft sieht sie immer noch aus wie geairbrushed
  8. In Räumen: auf die Details achten. Spiegelungen sind häufig nicht korrekt. Ich hatte auch schon mal Palmen in der Dusche.

Wie sollten wir deiner Meinung nach mit dem Thema Fake-Bilder / Fake-Videos umgehen? Brauchen wir eine Ethik für visuelles Storytelling mit KI? Einen Wertekodex? Neue Gesetze?

Meiner Meinung nach ja! Und zwar wäre solch ein Wertekodex ein Dreiklang aus Auflagen für Creators, Entwickler:innen/Unternehmen und Gesellschaft.

Wertecodex: Verantwortlichkeiten für alle im Umgang mit generativer KI

  1. Verantwortungsbewusste Nutzung: Deepfakes und manipulative Inhalte dürfen nicht zur Täuschung von Menschen genutzt werden. Weiterhin sollten KI-Bilder nicht zur Förderung von Hass, Diskriminierung oder anderen schädlichen Inhalten genutzt werden.
  2. Kennzeichnungspflicht: Alle KI-generierten Inhalte sollten klar und freiwillig als solche gekennzeichnet sein (z. B. durch Wasserzeichen oder Metadaten)
  3. Einhaltung von Altersrichtlinien: Inhalte, die Gewalt, Pornografie oder andere schädliche Darstellungen beinhalten, sollten klar gekennzeichnet werden und nur auf »FSK 18« Plattformen zu sehen sein.
  4. Aufklärung: Creators sollten über die Funktionsweise und die ethischen Herausforderungen von KI-Bildgenerierung aufgeklärt werden.
  5. Lizenzpflicht: Die Verwendung von Trainingsdaten und Vorlagen sollten den geltenden Urheberrechtsgesetzen entsprechen. (wenn ich z.B. ein eigenes Imagemodell trainiere)
  6. Vermeidung sensibler Daten: Keine Abbildung privater oder sensibler Informationen in KI-Bildern. Insbesondere nicht von Dritten!

Bias minimieren: Ethische Richtlinien für den Schutz von Urheberrechten

Entwickler von KI-Bildgeneratoren und Unternehmen sollten ethische Richtlinien implementieren, die den Schutz von Urheberrechten berücksichtigen:

  1. Diversität fördern: KI-Systeme sollten so entwickelt und trainiert werden, dass sie die Vielfalt von Kulturen, Geschlechtern und Ethnien repräsentieren.
  2. Bias minimieren: Entwickler:innen sollten aktiv den Gender-Bias und Stereotype in ihren Modellen erkennen und minimieren.
  3. Ökologischer Fußabdruck: Minimierung der Umweltbelastung durch KI-Modelle z. B. durch energieeffiziente Algorithmen oder Rechenzentren, die mit erneuerbarer Energie versorgt werden
  4. Viel bessere Arbeitsbedingungen und Entlohnung der Menschen, die KI-Bilder taggen müssen: Diese erhalten oft sehr niedrige, nicht vertretbare Löhne in Höhe von unter 2 Dollar / Stunde. Somit besteht ein krasser Gegensatz zwischen den milliardenschweren Tech-Unternehmen und den ausgebeuteten Arbeiter:innen, was ethisch nicht vertretbar ist. Hinzu kommt, dass die Arbeit in der Regel leistungsbasiert ist und die Arbeiter:innen immer wieder auch mit verstörenden und traumatisierenden Inhalten konfrontiert werden.

Aufklärung und Dialog: Die Gesellschaft für den Umgang mit KI sensibilisieren

Und für die Gesellschaft sehe ich folgende Punkte als wichtig an:

  1. Sensibilisierung: eine noch verstärktere Sensibilisierung der Gesellschaft durch Bildungsarbeit (Workshops, Seminare oder öffentliche Vorträge etc.), um die Bevölkerung über die Funktionsweise und die Risiken von KI-generierten Bildern aufzuklären.
  2. Medienkampagnen: Aufklärungskampagnen via Social Media, TV und Printmedien initieren, die auf die Gefahren von Deepfakes oder manipulierten Bildern hinweisen.
  3. Offene Diskussionen: Regelmäßig Evaluierung und Anpassung des Wertekodex basierend auf Feedback der Community/Gesellschaft
  4. Gesellschaftlicher Dialog: Auf Podiumsdiskussionen Raum für Diskussionen schaffen, bei denen die verschiedene Perspektiven von Künstler:innen, Ethiker:innen, Technolog:innen einfließen können.

Kennzeichnung und Gesetze dringend nötig

Schon jetzt gibt es im EU AI Act eine Transparenzpflicht. Das heißt, »künstlich erzeugte oder bearbeitete Inhalte (Audios, Bilder, Videos) müssen eindeutig als solche gekennzeichnet werden«. Was natürlich keiner macht, der Deepfakes bewusst und böswillig einsetzt. Aber zumindest ist es somit eine Straftat und kann geahndet werden.

Als konsumierende Gesellschaft kommen wir jedenfalls nicht umhin, zukünftig die Kontexte von Abbildungen zu hinterfragen.

Vielleicht wäre es aber auch denkbar, wenn die Flut an KI-generierten Bildern überhandnimmt, die echten Bilder als solche zu kennzeichnen, weil sie sich dann sogar noch deutlicher abheben.

Video ist der klare Trend im visuellen Storytelling mit KI

Wie wird sich deiner Meinung nach der Einsatz von KI im visuellen Storytelling entwickeln? Was passiert 2025?

Ganz klarer Trend für Storytelling in 2025 ist das Videoformat. Sehen wir ja mittlerweile sogar auch vermehrt auf Linkedin. Tools wie RunwayML, KLING AI, Luma Dream Machine, Hailou Minimax bieten jetzt schon superspannende Möglichkeiten.

Ich kann eigene Modelle mit Charakteren, Stilen oder Produkten trainieren, Bilder zum Sprechen bringen, Avatare generieren, Videos per »First Frame, last Frame« erstellen, per Motion Brush in Bewegung bringen usw.
Pika hat z.B. vorgefertigte Effekte, die z.B. ein Motiv eines Bildes zum Platzen bringen oder in die Luft steigen lassen etc.

Dank multimodaler Modelle (also Modelle, die Text, Bilder, Audio und Videos nahtlos verstehen und erzeugen können), können die Ergebnisse noch schneller und effizienter generiert werden.

Sprachsteuerung ist ebenfalls en vogue: Wir suchen uns die netteste Stimme aus uns gehen per Dialog ins Sparring. Übrigens, jetzt endlich auch bei ChatGPT in der Desktop Version eingeführt.

Personalisierung: Generative KI wird es ermöglichen, visuelle Inhalte in Echtzeit an individuelle Nutzer anzupassen. Dies wird zu hochgradig personalisierten und interaktiven Storytelling-Erlebnissen führen, die die Aufmerksamkeit und das Engagement der Zielgruppe erhöhen.

Komplexe visuelle Storytelling-Kampagnen werden selbstständig entwickelt

Was können wir bis Ende des Jahrzehnts erwarten?

Da sehe ich folgende Schwerpunkte:

  1. Immersive Technologien: Virtual Reality (VR) und Augmented Reality (AR) werden zunehmend mit generativer KI verschmelzen, um noch immersivere und interaktive visuelle Geschichten zu erzählen.
  2. Autonome KI-Agenten: Bis zum Ende des Jahrzehnts werden autonome KI-Agenten in der Lage sein, komplexe visuelle Storytelling-Kampagnen über verschiedene Kanäle hinweg selbstständig zu entwickeln, zu prüfen und anzupassen.

Insgesamt wird generative KI das visuelle Storytelling grundlegend verändern und neue Möglichkeiten für kreative Ausdrucksformen, Effizienzsteigerungen und personalisierte Erlebnisse schaffen. Unternehmen und Kreative, die diese Technologien frühzeitig adaptieren und in ihre Storytelling-Strategien integrieren, werden einen Wettbewerbsvorteil haben und die Zukunft der visuellen Kommunikation maßgeblich mitgestalten.

Die besten Tools für visuelles Storytelling mit KI

Zum Schluss eine praktische Frage: Welche Tools empfiehlst du für welchen Zweck?

Hier meine Auswahl der wichtigsten Tools:

Fotorealistische Bildgenerierungen

  • Midjourney
  • Flux AI (die verschiedenen Modelle sind z.B. über Krea AI, Freepik, Replicate anwählbar)
  • Leonardo AI (superviele verschiedene Modelle)
  • Recraft AI

Text in Bildern generieren

  • Ideogram
  • Flux AI

Stilkonsistenzen generieren und anwenden

  • Midjourney: via Style Tuner (nur über Discord) und via Style Codes
  • Leonardo AI
  • Freepik
  • Krea AI

Eigene Modelle trainieren (Character, Style)

  • Flux AI
  • Krea AI
  • Leonardo AI

Retexture

  • Midjourney
  • Freepik
  • Magnific AI

Upscaling

  • Magnific AI
  • Topaz AI

Video first frame, last frame

  • Luma Dream Machine
  • Freepik
  • RunwayML
  • Hailuo AI Minimax
  • KLING AI
  • Krea AI (als Plattform für verschiedene Videomodelle wie Kling, Luma, Hailuo, Runway)

Witzige und weitere Bewegungs-Effekte:

  • Pika
  • Immersity AI

Voice Generation

  • Elevenlabs
  • Hailuo
  • RunwayML
Djanes

Djanes im Stil großer Künstler

Stefanie Krüll in Social Media: