Generative Künstliche Intelligenz im kreativen Agenturalltag 

Optimization Geschrieben von Simon Böhm

Simon Böhm

Generative Künstliche Intelligenz im kreativen Agenturalltag 

Ein Praxisfazit nach dem Hype 

In den letzten knapp zwei Jahren gab es ein großes Aufsehen um LLMs (Large Language Models) sowie generativer KI, was zu vielen spekulativen Behauptungen über deren Potenzial führte. Vorhersagen über transformative Auswirkungen auf unterschiedliche Branchen und Arbeitsmärkte wurden gemacht. Es gab Vergleiche zu technologischen Fortschritten so bedeutsam, wie die Erfindung des Internets. Und es wurde gemunkelt, dass in naher Zukunft bereits komplette Hollywood-Blockbuster rein mittels Künstlicher Intelligenz erstellt werden können. Kurz gesagt: KI und wie sich das Leben dadurch verändern wird, war in aller Munde. 

ChatGPT, Stable Diffusion, Midjourney und Co zählen nur zu einem Bruchteil der KI-Tools, die dieser „KI-Revolution“ entsprungen sind. Dass sie die Branche aufgerüttelt haben, steht außer Frage, noch wichtiger wird deshalb zu unterscheiden, wo es (im Moment) tatsächlich praktikablen Nutzen gibt, und wo der reine Hype noch überwiegt – ein Hype, welcher die praktischen Anwendungen von KI-Tools verzerrt oder gar verschleiert. Wer wie wir mit digitalen Produkten arbeitet und sich in dieser Welt bewegt, hat meiner Meinung nach auch immer automatisch einen Bildungsauftrag. Das Anliegen der dreifive ist hier klar: wir unterstützen es definitiv, sich immer mit der Veränderung mitzubewegen – aber jeder Hype, jedes Produkt und auch jedes womögliche Versprechen, dass diese machen, sollen auch kritisch hinterfragt werden. Folgend möchte ich Vor- und Nachteile von generativen KI-Tools für kreatives Arbeiten besprechen, sowie deren Grenzen in aktuellen Anwendungsfällen für digitale Designprozesse aufzeigen. 

Disclaimer: Die Thematik rund um generative KI ist noch sehr neu und stetig wandelnd. Zudem ist sie so breit gefächert, dass im Rahmen dieses Blogbeitrags unmöglich jedes Detail beschrieben werden kann. Daher bezieht sich alles Geschriebene rein auf den Aspekt der Produktivität und Kreativität in der tagtäglichen Agenturarbeit im Kreationsprozess. Themen wie ethischer oder ressourcenschonender Umgang mit KI spielen natürlich auch eine tragende Rolle, jedoch würde dies den Rahmen des Blogbeitrags sprengen. 

Effizienteres Arbeiten im Daily Business – generativer KI sei Dank!  

Zu Beginn Aspekte, die den Agenturalltag definitiv bereichern: Content-Ideen können mittels generativer KI sehr schnell visualisiert werden. Insbesondere für Storyboarding, Visuals für Präsentationen oder auch generelles Brainstorming helfen Tools wie Midjourney, Dall-E oder Adobe Firefly, um ein schnelles Resultat für individuelle Mockups zu generieren. ChatGPT kann zudem Aushilfe schaffen, wenn man Inspiration für Texte benötigt.  

Generative Expand mittels Photoshop: Bilder können in kürzester Zeit erweitert werden, zum Beispiel kann ein quadratisches Foto ohne weiteres für eine Instagram Story ins Hochformat angepasst werden, ohne croppen zu müssen oder zeitaufwändige Retuschearbeiten durchzuführen.

Auch die bereits integrierten Methoden von Photoshop, wie „generative Fill“ oder der „Remove Brush“ sind wertvolle Zeitsparer – Fotoretuschen, die früher etliche Stunden an Arbeit gekostet haben, können nun in Sekunden erledigt werden. KI-Upscaler, wie zum Beispiel Gigapixel von Topaz AI können schlecht aufgelöste Bilder, die für viele Anwendungen unbrauchbar wären, wieder restaurieren.  

KI-Upscaling im Vergleich: links ein Bild mit geringer Auflösung, das deutliche Unschärfe/Artefakte aufzeigt. Durch den Upscalevorgang konnten Details zurückgewonnen und das Bild kann in guter Qualität genutzt werden.

All diese Usecases sind extrem vorteilhaft im hektischen Agenturleben, wo oft in kürzester Zeit qualitativ hochwertige Visuals erforderlich sind. Doch genau hier möchte ich nun anschneiden, wenn es um einen der Nachteile solcher KI-Tools geht: Qualität.  

Obwohl Grenzen gesprengt werden, gibt es Grenzen 

Ein Blick auf die Resultate von „KI-Kunstwerken“ kann den Anschein erwecken, dass die erzeugten Bilder nahezu perfekt und fehlerfrei sind. Wenn man jedoch genauer hinsieht, kann man oft erkennen, dass spezifische Details falsch oder auch Konzepte wie Physik, Licht oder Anatomie inkorrekt umgesetzt werden. Wie wichtig diese Faktoren für den Individualfall sind, liegt nicht an uns zu beurteilen, aber es muss zumindest ein Bewusstsein dafür herrschen, dass es gewisse Einschränkungen gibt. Natürlich lernen die Modelle, somit kann KI nur besser werden und solche Mankos mit der Zeit ausgeheben, zum jetzigen Zeitpunkt sind sie für eine qualitative Bewertung aber nicht zu vernachlässigen. 

KI-Halluzinationen (Midjourney v6): Beispiele für problematische/falsche Generationen bei zwei Bildern. Beim linken Bild können Fehler an den Händen der Personen gefunden werden, außerdem schwebt der Blumentopf ohne Halterung über dem Paar. Im rechten Bild ist zu erkennen, dass sowohl am Horizont, als auch in der Spiegelung des Fahrzeugspiegels die Sonne zu sehen ist, was physikalisch nicht möglich sein kann.

Auch bei textbasierten Modellen wird hier oft von sogenannten Halluzinationen gesprochen: Die KI erzeugt oftmals falsche oder unsinnige Ergebnisse aufgrund der inhärenten Grenzen von Rechenleistung und Trainingsdaten, was sie für kritische Anwendungen (noch) unzuverlässig macht. Im Zeitalter von Fake News, welche beispielsweise politische Entscheidungen für Millionen von Menschen beeinflussen können, wird es nochmal deutlicher, wie wichtig es ist, erhaltene Ergebnisse einem zweiten oder sogar dritten prüfenden Blick zu unterziehen.  

Wer versteht, kann über den eigenen Horizont hinausblicken 

Wer nämlich kritisch prüft und auch den Anspruch hat, zu verstehen, wie diese Tools funktionieren, kann auch wieder vom (für Kreative oft vernichtendem) Urteil wegblicken.  Tatsache ist, dass diese Tools in den meisten realen Anwendungsfällen nur als Sprungbrett für die Umsetzung von Visuals oder einer kompletten Kampagne dienen. Damit eine kreative Idee in Folge tatsächlich das Licht der Welt erblicken kann, braucht es Handwerk, Erfahrung und Inspiration von Filmschaffenden, Fotografen und Designern. Kaum ein KI-generiertes Bild wird unbearbeitet an einen Kunden geschickt, es muss so gut wie immer eine Nachjustierung passieren. Und kaum eine Idee entwickelt sich aus einer schnellen Laune eines Tools heraus, sondern es benötigt Lenkung und Vorgaben, um es für die eigenen Zwecke arbeiten zu lassen.  

Wenn das Fachwissen nicht vorhanden ist, wird es zusätzlich schwierig, passende Prompts für die KI-Tools zu verfassen, gerade wenn es spezifische Details und Fachbegriffe für beispielsweise Lichtsetzung, Farben und Stilmittel oder Kameraeinstellungen wie Brennweiten, Einstellungsgrößen oder Blendenstufen benötigt. Zudem ist bei der Nutzung der gängigen Tools immer ein gewisser Zufallsanteil im Spiel. Zwei Generationen mit ein und demselben Prompt werden nie ein identisches Resultat liefern. Im Endeffekt bedeutet das, dass der Einsatz von generativen KIs auf ersten Blick und für viele Bereiche effizient und zeitsparend ist, jedoch bei genauerem Betrachten bei anderen Arbeitsschritten einfach nur eine andere Form von Arbeit mitbringt.  

Unterschiede in der Generation: Die 4 zu sehenden Bilder sind alle anhand des selben Prompts in Midjourney v6 entstanden "a young man is riding a red bicycle in a bustling european city", was zeigt, dass generative KI-Tools nicht immer berechenbar sind. Dies zeigt auf, dass es ohne detailliertes Prompting und Fachwissen schwierig ist, ein konsistentes Bild zu erstellen. Dinge wie Position des Mannes, Tageszeit, Art des Fahrrads, Gewand oder Körperbau werden von der KI per Zufall festgelegt. Bei vielen Tests lassen sich zudem bestimmte Muster erkennen, zum Beispiel war der Mann bei über 20 generierten Bildern immer weiß und hatte kurze, braune Haare.

Der Hype nach dem Hype 

Spannend als Agentur ist auch zu beobachten, dass sich aus dem KI Hype bereits wieder eine Gegenwelle bildet. Besonders bei neueren Online-Plattformen wie TikTok, geht der Trend in Richtung Authentizität und Verbundenheit, also weg von künstlich erschaffen. User Generated Content und „unprofessionelle“ Videos, die einen Gegensatz zu den Hochglanz-Produktionen der traditionellen TV-Werbung bilden, kommen gut an, da sie menschlich wirken. Insbesondere hier hinkt KI noch weit hinterher. Auch wenn es bereits etliche Bots und virtuelle KI-Influencer gibt, wirken diese eher unheimlich – Stichwort Uncanny Valley. Umsetzungen dieser Art werden in der Regel abgelehnt und mit negativen Kommentaren oder sogar Shitstorms bombardiert. 

Was heißt das jetzt für den Alltag? 

All diese Komplikationen können nun den Eindruck erwecken, dass die beschriebenen Tools eher Spielereien sind und nur wenig zur Effizienz bei der Erstellung von kreativen Ideen und Visuals beitragen. Allerdings kann ich das nicht so leicht pauschal beantworten und muss daher sagen: „es kommt darauf an.“ 
Bestimmte Anwendungsfälle benötigen nur leichte Bearbeitung, beispielsweise einen anderen Bildausschnitt, um ein Foto aus einem quadratischen Bildformat ins Hochformat zu bringen. In diesem Fall kann mittels KI schnell der Hintergrund erweitert werden, und leichte Artefakte oder Halluzinationen der KI, die sich in einem sowieso unscharfen Bildbereich befinden, können dann in der Regel ignoriert werden.  
Möchte ich jedoch mittels KI eine aufwändigere und realitätsgetreue Bilderreihe für eine Kampagne erstellen, in der eine spezifische Person in unterschiedlichen Situationen vorkommt, könnte man je nach genutzten Modellen schnell auf Grenzen stoßen – sei dies aufgrund von Settings, die von der KI nicht gut genug umgesetzt werden können oder auch einer mangelnden Konsistenz im Aussehen der Hauptdarsteller. Außerdem muss man abwiegen, ob generative KI nicht schlicht und einfach das falsche Mittel zum Zweck für bestimmte Aufgaben ist: Auch wenn man mit einem enormen Arbeitsaufwand für eine solche Bild- oder Videoreihe mittels KI-Tools ein gewünschtes Resultat erreichen würde, wäre es nicht vielleicht einfacher und auch zeiteffizienter gewesen, wenn man konventionelle Methoden genutzt hätte? Oder muss man unbedingt ein KI-Tool für die Bilderstellung nutzen, für die man extra Aufwand reinstecken muss, wenn bereits tausende, für den Anwendungsfall passende Stockbilder existieren? 

Praxisbeispiel für den Einsatz von KI auf Social Media: Für unseren Kunden Baloise haben wir mittels KI eine Kampagne für eine Autoversicherung umgesetzt, bei der fantastische und unmögliche Situationen mittels generativer Bilderstellung gezeigt werden.

Bei der Implementierung von KI-Technologien, ist es daher wichtig, einen pragmatischen Ansatz zu wählen, kritisch über neue Technologien zu denken und weder einem Hype noch einem Anti-Hype blind zu folgen. Dazu gehört es, die derzeitigen Grenzen zu erkennen und zu untersuchen, wie sie in Arbeitsabläufe integriert werden können, um die Produktivität zu steigern, ohne unrealistischen Erwartungen zum Opfer zu fallen. Ideenfindungen, Konzeptentwicklungen bis hin zum Endergebnis könnten durch KI gestützt werden und die Zusammenarbeit mit Künstlicher Intelligenz ist zukünftig aus dem Kreativprozess wahrscheinlich nicht mehr wegzudenken. 

Für uns in der Agentur ist KI ein wertvolles Werkzeug bei kreativen Prozessen, jedoch kein Ersatz für menschliche Kreativität und wir streben danach, sie immer genau dort zum Einsatz zu bringen, wo Menschen allein an die Grenzen des überhaupt Möglichen kommen würden – nicht danach, diese Menschen über kurz oder lang zu ersetzen.  

Quellen: