Neue Generation: Photoshop-Bilder mit KI

Bildgeneratoren auf KI-Basis haben 2023 eine neue Epoche der Bildbearbeitung eröffnet. Wir testen, was das neue Adobe Photoshop kann, und ob die integrierten KI-Funktionen bereits praxistauglich sind.


ChatGPT, Midjourney, Dall-E: Das Jahr 2023 hat das Thema „Künstliche Intelligenz“ in die breite Öffentlichkeit gebracht. Funktionen zum automatischen Erstellen von Texten und Bildern stehen zur allgemeinen Verfügung und werden in rasantem Tempo weiterentwickelt. Adobe, Platzhirsch im Bereich der grafischen Industrie, hat mit Adobe Firefly eigene KI-gestützte Tools vorgestellt. Damit lassen sich z.B. fotorealistische oder künstlerische Abbildungen erzeugen, Vektorgrafiken umfärben oder Vorlagen für Social Media Posts erstellen. Vieles davon befindet sich jedoch noch im Beta-Stadium.

Eines dieser Tools, die „Generative Füllung“, wurde bereits in die neue Version von Adobe Photoshop integriert. Und trotz aller Vorbehalte und technischen Beschränkungen: Es ist revolutionär. Eine neue Epoche der Bilderstellung und -bearbeitung hat begonnen!

Was ist Generative Füllung?

Kurz gefasst: Das gewünschte Motiv wird in einem Textfeld beschrieben, und das Firefly-System erzeugt dazu mehrere Bildvarianten (Text-zu-Bild). Das funktioniert vom Prinzip her wie bei anderen KI-Bildgeneratoren auch. Bei Adobe ist das Ganze jedoch praxisorientiert gestaltet und in eine umfangreiche Bildbearbeitungssoftware integriert. So lassen sich z.B. einzelne Bildbereiche gezielt verändern, und die entstandenen Abbildungen dürfen kommerziell genutzt werden.

Eine Vorstellung davon bekommen Sie in diesem Video von Stephan Wiesner:

Test 1: Fläche erweitern (Outpainting)

Beginnen wir mit einem einfachen Anwendungsfall: Ein vorliegendes Bild soll nach außen erweitert werden. Dazu wird die neue Fläche angelegt und ausgewählt; die KI analysiert das bestehende Motiv und generiert automatisch drei Füllungsvarianten.

Das klingt vielleicht nicht gerade revolutionär. In der Praxis kommt dieser Fall jedoch häufig vor, z.B. wenn ein Motiv nicht in ein querformatiges Banner passt, oder wenn beim möglichen Bildausschnitt die abgebildete Person an der falschen Position sitzt. Das Revolutionäre liegt in der Schnelligkeit und Qualität der Füllung – mit bisherigen Photoshop-Werkzeugen war so etwas, wenn überhaupt, nur mit großem Aufwand möglich. Die alte „inhaltsbasierte Füllung“ z.B. bringt nicht einmal eine gerade Verlängerung von perspektivischen Linien oder Kanten zustande.

Left ImageRight Image

Test 2: Bildelemente ändern

Nach dem Auswählen eines Bereichs wird im Texteingabefeld beschrieben, was die KI generieren soll. Dafür reicht eine einfache Rechteckauswahl oder eine schnelle automatische Auswahl oft schon aus. Die Möglichkeiten sind unendlich:

  • Entfernen von Objekten, automatisches Füllen des Hintergrunds
  • Ersetzen von Bildteilen: offene Augen statt „Blinzelaugen“, Kleidungsstücke austauschen oder Farbe ändern, Werkzeug in einer Hand ersetzen…
  • Komplett neue Objekte einfügen: Personen, Tiere oder Häuser in eine Landschaft einbauen, Gegenstände in eine Szene einsetzen, Lichteffekte am Himmel erzeugen…
  • Hintergrund austauschen

Funktioniert das? Beim nächsten Bild habe ich es ausprobiert. Die geometrische Struktur der Gebäude bildet dabei eine schwierigere Ausgangssituation als die Landschaft oben, aber das sollte bei den meisten durchgeführten Änderungen nicht entscheidend sein.

Das Entfernen von Objekten oder der Austausch des Himmels hat ganz passabel funktioniert. Beim Erstellen neuer Objekte bietet sich dagegen ein sehr gemischtes Bild. Die Generative Füllung erzeugt zwar Vorschläge, die hinsichtlich Ausleuchtung und Schattenwurf ganz gut ins Umfeld passen, doch die Qualität der Motive schwankt enorm. Mit dem Weihnachtsbaum bin ich zufrieden, der Obststand links und der Turm sind so lala. Die erzeugten Personen, Fahrzeuge, Schilder u.ä. sind bei genauer Betrachtung alle unbrauchbar (das hier sind noch die besten Varianten) und manchmal schlichtweg falsch: Der Versuch, einen weißen Oldtimer einzufügen, lieferte nur schwarze Fahrzeuge (ohne Abbildung); der Straßenmusiker sollte eigentlich explizit einen Kontrabass spielen. Da muss die KI noch deutlich zulegen. Klicken Sie sich mal durch die kleinen Abbildungen.

Left ImageRight Image

Test 3: Neues Bildmotiv

KI-Generatoren wie Midjourney sind für das freie Erstellen komplett neuer Bilder bekannt, und das ist natürlich auch mit Adobe Firefly möglich – dafür bietet Adobe neben den Photoshop-Tools auch die Online-Plattform Adobe Express an. So lassen sich z.B. Grafiken für Social Media Posts oder Beitragsbilder für Blogs erstellen. Grafischer Look, Helligkeit etc. lassen sich über die Bildbeschreibung festgelegen. Der Vorteil von Photoshop ist, dass das erzeugte Bild dann weiterbearbeit werden kann: durch Auswahl und Neufüllung einzelner Bereiche, und natürlich mit den klassischen Werkzeugen.

Für den nachfolgenden Test habe ich ein Standardmotiv gewählt und als Beschreibungstext eingegeben: „schreibtischarbeitsplatz mit laptop schreibwerkzeug obst und topfpflanzen im hintergrund unscharfes fenster“. Eines der Motive wurde dann überarbeitet und mit weiteren Elementen ausgebaut. Da alle Laptops irgendwie nach Macbook aussahen, versuchte ich, ein „HP Notebook“ zu generieren – das lehnte Firefly jedoch als „Verstoß gegen unsere Richtlinien“ ab (in diesem Fall: Markenrecht).

Auch wenn die Tastatur oder das Smartphone bei genauerer Betrachtung etwas schwächeln, kann sich das Ergebnis durchaus sehen lassen. Bei den meisten Motiven sind eine Reihe von Durchgängen nötig, bis eine akzeptable Variante vorliegt, manchmal sind aber auch überraschend gute Treffer dabei (z.B. das Saftglas). Und Ausleuchtung, Schattenwurf und Tiefenschärfe liefert die KI fast immer in guter Qualität.

Left ImageRight Image

Einschränkungen von Adobe Firefly

Keine Frage: Es ist phantastisch, was KI-Bildgeneratoren leisten. „Künstliche Intelligenz“ liefert dennoch keine Perfektion auf Knopfdruck. Der Weg zum professionellen Ergebnis führt hier über Trial and Error, Ausprobieren und Optimieren der Texteingabe – ein Aufwand, den man den Samples auf den Websites der jeweiligen KI-Tools nicht ansieht.

Abschließend seien noch allgemeine Einschränkungen der „Generativen Füllung“ genannt:

  • Qualität: Objekte weisen offensichtliche oder versteckte Fehler auf (s.o.)
  • Auflösung: Die generierten Füllungen haben maximal 2000 x 2000 Pixel
  • Motive: KI-Bildgeneratoren erzeugen ihre Motive auf der Grundlage allgemeiner Abbildungen (Stockfotos); konkrete Produkte, Personen oder Situationen bleiben außen vor, oder werden sogar explizit ausgeschlossen: Adobe verwendet Filter, um z.B. das Erzeugen von pornografischen, gewaltverherrlichenden oder gegen Personen- bzw. Markenrecht verstoßenden Abbildungen zu verhindern. Diese Filter können auch mal über’s Ziel hinausschießen.
  • Gebühren: Die Nutzung der KI-Funktionen von Adobe Firefly wird kostenpflichtig sein. Vorgänge, die über das Monatslimit hinausgehen, werden separat berechnet.

Weitere Informationen

Click to access the login or register cheese