Drag your GAN - KI-Bilder einfach mit der Maus verändern

// 12:33 Fr, 19. Mai 2023von Rudi Schmidts

Seit Monaten führen uns sogenannte Generative KI-Modelle (Generative Adversarial Networks, kurz GANs) vor Augen, dass Computer erstaunlich realistische Abbildungen der Welt um uns herum erzeugen können. Hierbei kommt jedoch kein Rendering im Sinne einer klassischen 3D-Repräsentation zum Einsatz.

Vielmehr werden Milliarden von Bildern in einem sogenannten Latent Space komprimiert abgelegt. Und zwar so, dass sie aufgrund ihrer Ähnlichkeit in verschiedenen Dimensionen nahe beieinanderliegen. Diese extrem vieldimensionale Speicherung lässt sich für Menschen schlecht vorstellen - obwohl oder wir in unseren Gehirnen vielleicht sogar unser Wissen mit ähnlichen Schemata "verwalten". So liegen beispielsweise alle lächelnden Personen in einer Dimensions-Achse nahe beieinander.

Um ein KI-Bild zu erzeugen, müssen wir "nur" dessen Koordinaten in diesem Raum angeben. Und diese Koordinaten entsprechen - einfach gesagt- den Begriffen im zugehörigen Prompt. Schon bisher konnte man durch Prompting versuchen, sich auf diesen Dimensions-Achsen im Latent Space zu bewegen, um nur Kleinigkeiten im Output zu ändern. "Negative Prompting" macht sich diese Idee ebenfalls zunutze.

// Top-News auf einen Blick:

Was jedoch bisher noch nicht funktioniert hat: Bildbereiche direkt durch die Maus zu bewegen. Man zieht also beispielsweise den Mundwinkel einfach durch Anfassen mit der Maus nach oben. Im Gegensatz zum einfachen Morphing, verändert sich bei "Drag your GAN" anschließend das gesamte Objekt passend hierzu. So können sich dadurch eventuell auch die Lippen etwas öffnen, Falten hinzukommen und/oder auch die Augen etwas schließen.

Das Ganze funktioniert jedoch nicht mit einem herkömmlichen Foto. Aufgrund des notwendigen Latent Space kann die Manipulation nur mit einem von der KI hieraus generierten Bild erfolgen. Dafür sind anschließend die Manipulationsmöglichkeiten so einfach wie noch nie zuvor. Eine große Zahl an animierten Beispielen hält die Projektwebseite bereit.

"Drag your GAN" stellt somit wohl den nächsten Meilenstein in der rasanten Entwicklung generativer KI-Modelle dar. Der entsprechende Code soll bereits im Juni zur Verfügung gestellt werden.

mehr Infos bei
vcai.mpi-inf.mpg.de

Auf Socials teilen:

Leserkommentare // Neueste

balkanesel // 13:32 am 19.5.2023

erstaunlich

Im Forum mitdiskutieren >>

Ähnliche News //

News

Das Holodeck ist da Google DeepMind Genie 3 - interaktive Welten in Echtzeit generieren

Googles DeepMind hat Genie 3 vorgestellt, einen interaktiven Weltengenerator, der per Prompt Welten erstellt, die dann in Echtzeit über die Cursorstasten erkundet werden können - ....

// 20:27 Di, 5. Aug 2025von Thomas Richter

News

Adobe führt Credit-basiertes Modell für generative KI ein (und die Creative Cloud ...

Zur IBC präsentierte Adobe aktuelle Beta-Versionen von Premiere Pro und After Effects mit interessanten Neuigkeiten, wie bereits beschrieben. Zeitgleich wurden auch die neuen ...

// 18:59 Mo, 18. Sep 2023von blip

News

SDXL-Turbo - Neuer KI-Algorithmus beschleunigt Stable Diffusion extrem

Wenn man über aktuelle Fortschritte bei generativen KI-Modellen berichtet fällt es gelegentlich schwer, nicht den Begriff "Gamechanger" zu bemühen. Beim aktuellen ...

// 09:05 Mi, 6. Dez 2023von Rudi Schmidts

News

Editing per Prompt Google Veo am Start - neue Video-KI macht über 60 Sekunden lange Clips

Während das einstige Spitzenmodell OpenAIs Sora noch immer nicht öffentlich ist, geht der Kampf um die beste Video-KI unvermindert geht weiter - jetzt hat Google sein erstmals Mai ...

// 11:52 Fr, 6. Dez 2024von Thomas Richter

News

Neue Nvidia-KI generiert Bilder 30x schneller als Stable Diffusion

Ein Forscherteam von Nvidia und der Universität Tübingen hat eine neue (alte) Methode zur Bildgenerierung per KI vorgestellt, welche gleich zwei große Vorteile gegenüber der ...

// 16:10 Mi, 8. Mär 2023von Thomas Richter

zur Newsübersicht >

Hollywood as a Service? ARRIs Color KnowHow könnte Millionen Wert sein - als Workflow Lizenz für Dritte

Kamera-Hardware und die Color-Science in der Firmware waren bei ARRI bislang untrennbar verbunden. Doch muss das auch weiterhin so sein?

// 15:44 Mo, 17. Nov 2025von Rudi Schmidts

Test

Entry-Level Cinema Kamera Canon EOS C50 im Praxistest: Kompaktes Arbeitstier mit 7K 50p Raw - die neue FX3 Konkurrenz

Mit der EOS C50 rundet Canon sein Cinema EOS Portfolio nach unten hin ab und bringt gleichzeitig einen direkten Konkurrenten zur erfolgreichen Sony FX3 auf den Weg. Wir haben uns ...

// 15:55 Do, 13. Nov 2025von Rob

Test

Hosentaschen-Alexa iPhone 17 Pro Max mit ProRes RAW - Rolling Shutter und Dynamik Sensortest

Wir hatten das iPhone 17 Pro Max bei uns im Sensortest. Und auch wenn sich bei der Signalverarbeitung grundsätzlich wenig Neues getan hat, überraschten uns die Ergebnisse mit ...

// 22:08 Fr, 7. Nov 2025von Rudi Schmidts

Test

Alive and Kicking Blackmagic Pocket Cinema Camera 4K Sensor-Test - Wiedersehen mit ProRes RAW

Nachdem Blackmagic seinem Pocket Kamera-Klassiker ein unerwartetes ProRes RAW Update beschert hat, fragen wir uns, für wen sich das neue RAW Format eigentlich lohnt...

// 13:49 Fr, 31. Okt 2025von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Meinung

Midjourney trifft Pika Labs: Generative KI -Videos - Was geht, was kommt?

Seitdem Midjourney oder Stable Diffusion fotorealistische Bilder generieren kann, will man natürlich auch realistische Bewegungen "digital erträumen". Doch das erweist sich für ...

// 10:22 Fr, 29. Sep 2023von Rudi Schmidts

Praxis

Mattepainting für Dummys - mit Photoshops Generative Fill Funktion

Wir hatten schon einmal kurz auf Photoshops "Generative Fill"-Möglichkeiten im Zusammenhang mit Videoaufnahmen hingewiesen. In diesem Workshop möchten wir zeigen, wie die ...

// 13:26 Mi, 16. Aug 2023von Rudi Schmidts

zur Artikelübersicht >

Aktuelle News //

News

Top Deals für Filmemacher Erste Black Friday Angebote von Atomos, Nanlite, DZOFILM und mehr

Die vielen Rabattaktionen rund um den Black Friday (der dieses Jahr auf den 28. November fällt) sind immer wieder eine gute Gelegenheit für ein Schnäppchen - gerade wenn man ...

// 12:24 Di, 18. Nov 2025von Thomas Richter

News

Leichte Budget-Optiken Meike und Viltrox mit neuen 85mm Portrait-Telebrennweiten

Für Kameras mit Sony E- und Nikon Z-Mount erscheinen zwei neue, günstige Objektive, das Viltrox AF 85mm F2.0 EVO sowie das Meike 85mm f/1.8 SE II. Letzteres ist eine überarbeitete ...

// 09:48 Di, 18. Nov 2025von blip

zur Newsübersicht >