Das Holodeck ist da Google DeepMind Genie 3 - interaktive Welten in Echtzeit generieren

// 20:27 Di, 5. Aug 2025von Thomas Richter

Googles DeepMind hat Genie 3 vorgestellt, einen interaktiven Weltengenerator, der per Prompt Welten erstellt, die dann in Echtzeit über die Cursorstasten erkundet werden können - ganz ähnlich wie im berühmten Holodeck von Star Trek. So ein offenes Weltmodell ist in mehrfacher Hinsicht revolutionär, denn Google hat in der dritten Generation seines World Building Models gleich mehrere Probleme gelöst.

Konsistente interaktive Welten

So sind die generierten Welten jetzt sehr konsistent. Das Modell besitzt ein "Gedächtnis", d. h. die Bilder werden zwar ständig neu live generiert, aber die Welt wird nicht ständig völlig neu erstellt, sondern ein einmal besuchtes Objekt bzw. ein Ort ist bei einem zweiten Besuch immer noch identisch – was fundamental wichtig ist für das Gefühl, eine andere Welt zu erkunden. Genie 3 ist zwar nicht perfekt (das Gedächtnis umfasst nur die letzte Minute, die ganze Umgebung immerhin mehrere Minuten), aber schon besser als bisherige Modelle.

Zusätzlich zur ganzen Welt können auch spezifische Objekte gepromptet werden, wie hier etwa ein Gorilla im roten Frack:

Beeindruckend ist auch die Qualität der in Echtzeit erzeugten Bilder – das Live-Video besitzt eine Auflösung von 720p (1.280 x 720 Pixel) bei einer Bildwiederholungsrate von 20-24 Frames pro Sekunde. Auch bei schneller Bewegung sind in den Demovideos keine Fehler zu entdecken – sie geben tatsächlich das Gefühl, in einer anderen Welt zu wandern, denn die erzeugten Welten sehen nahtlos aus in allen Richtungen.

Genie 3 "versteht" die Welt mitsamt aller physikalischen Gesetze, ganz wie Video-KIs wie Veo 3 oder Sora, und kann so Räumlichkeit täuschend simulieren. Das Modell "weiß", dass Wasser Licht spiegelt und bei Berührung Wellen schlägt, wie Wellen sich verhalten, wenn sie auf feste Objekte treffen, wie Objekte sich bei Kollision verhalten, abhängig von ihrem relativen Gewicht und ihrem Material, wie etwa bei der Kollision mit einem der Lampions im ersten Clip oben.

Neben echten Welten können aber genauso gut auch fantastische Traumwelten generiert und erkundet werden. Der Fantasie sind dabei wie schon bei den Bild- und Video-KIs keine Grenzen gesetzt bezüglich Ort, Stil und zusätzlichen Objekten:

Hier das zugehörige Prompt:

Ein lebendiger 3D-Stil, ein entzückendes, flauschiges Wesen, das über eine leuchtende Regenbogenbrücke in einer fantastischen Landschaft springt. Die Kreatur ist klein und kompakt, mit einem Fell, das die warmen Farbtöne eines Sonnenaufgangs imitiert – Orange-, Gelb- und Rosatöne, die nahtlos ineinander übergehen. Ihr auffälligstes Merkmal ist ein Paar großer, aufgerichteter Ohren, geformt wie die eines Deutschen Schäferhundes, was einen verspielten Kontrast zu ihrer ansonsten runden Form bildet.

Während sie auf vier kurzen Beinen über den Regenbogen rennt, scheint ihr Fell zu fließen und zu schwingen, was ihr ein Gefühl von Dynamik und Energie verleiht. Die Regenbogenbrücke spannt sich anmutig durch eine verspielte Landschaft, vielleicht mit schwebenden Inseln, leuchtender Flora und wirbelnden Wolken.

#Genie3 is a real, interactive, playable experience.

We&re having so much fun with it at work---in between meetings, during breaks.

Here&s @RuiqiGao, @joeaortiz, @ChrisWu6080 following a pack of polar bears through a New York City street! Check out more on the webpage:… pic.twitter.com/D9uyMZHo11
— Aleksander Holynski (@holynski_) August 5, 2025

Die Beleuchtung ist hell und fröhlich und taucht die Kreatur und ihre Umgebung in ein warmes Licht. Der Gesamteindruck ist von Freude, Staunen und grenzenloser Energie geprägt – er fängt den verspielten Geist der Kreatur und die magische Natur der Welt, in der sie lebt, perfekt ein. Dieses Bild weckt ein Gefühl kindlicher Fantasie und lädt den Betrachter ein, sich die Abenteuer vorzustellen, die dieses charmante Wesen in seinem fantastischen Reich noch erwarten.

Die Welten sind zudem nicht statisch generiert, sondern es können auch dynamische Ereignisse per Prompt geskriptet werden, wie etwa ein sich änderndes Wetter, neu auftauchende Objekte oder Charaktere. Weitere Beispiele zeigen auch eine Interaktion mit der Umwelt, die dauerhafte Spuren hinterlassen:

Wozu?

// Top-News auf einen Blick:

Durch ihre Interaktivität besitzen die Welten eine ganz andere Immersion als reine Videos, die ja jetzt auch schon per Video-KI erzeugt werden können. Die Anwendungsmöglichkeiten sind natürlich vielfältig, angefangen von Spielen, die in einer beliebigen, vom User gewünschten Welt situiert sein können, über Reisen in andere Welten oder Zeiten wie etwa hier zum Palast von Knossos:

Und natürlich ergeben sich auch fürs (KI-)Filmmaking völlig neue Möglichkeiten, kann doch eine virtuelle Welt erkundet werden nach dem optimalen Drehort und Kamerawinkel oder Kamerafahrten exakt geplant werden.

Um sich noch mehr nach dem Holodeck anzufühlen, ist wahrscheinlich angesichts der noch nicht so weit entwickelten holografischen Lösungen die Reise per VR-Brille schon ausreichend immersiv dank ihrer 3D-Interaktivität.

Es sind auch viele weitere Anwendungsfälle denkbar in den Bereichen Lernen, Industrie und etwa Tourismus.

Ein Schritt auf dem Weg zur AGI

Ein besonders wichtiges Anwendungszenario stellt Genie 3 als Simulationsumgebung für KI-Agenten dar, die anhand der Interaktion mit der künstlichen Welt Erfahrungen für die echte Welt sammeln können – viel weniger aufwendig als über eine echte physikalische Interaktion per Roboter. Der Agent kann die visuelle Welt von Genie 3 und ihre Objekte erkennen und Kommandos an Genie 3 senden und so damit interagieren und in der Welt navigieren – z. B. um bestimmte Gegenstände zu identifizieren oder auch um zu lernen, um Hindernisse herumzunavigieren.

One nice thing you can do with an interactive world model, look down and see your footwear ... and if the model understands what puddles are. Genie 3 creation. pic.twitter.com/OZfsWxYe03
— Matt McGill (@MattMcGill_) August 5, 2025

Anhand solcher künstlichen "echten" Umgebungen können Agenten viel schneller trainiert werden als in der Realität (wie etwa DeepMinds universale Spiele-KI Alpha Zero, die sich selbst durch Millionen von Durchgängen in allen möglichen Games trainieren konnte) – 100fach und parallel. Ein wichtiger Schritt auf dem Weg zur AGI, zur Künstlichen Intelligenz, die übermenschliche oder mindestens menschliche kognitive Fähigkeiten in allen intellektuellen Aufgabenbereichen besitzt und mit die echte Welt "versteht" und mit ihr interagieren kann.

Was kann Genie 3 (noch) nicht?

DeepMind gibt aber auch Auskunft über die Beschränkungen, die Genie 3 noch aufweist. So ist etwa der Handlungsspielraum der Agenten derzeit begrenzt, da sie nur eine eingeschränkte Anzahl direkter Aktionen ausführen können. Auch die realistische Interaktion und Simulation mehrerer unabhängiger Agenten in gemeinsamen Umgebungen stellt weiterhin eine Herausforderung dar. Zudem kann Genie 3 reale geografische Orte nicht mit vollständiger Genauigkeit darstellen. Und eine klare und lesbare Textdarstellung gelingt meist nur, wenn der entsprechende Text bereits in der Eingabebeschreibung enthalten ist. Schließlich ist die Dauer der möglichen Interaktionen aktuell auf einige Minuten begrenzt und erlaubt noch keine längeren, durchgehenden Simulationen. Das sind aber alles Beschränkungen, die in den nächsten Generationen vermutlich Stück um Stück fallen werden.

Momentan können nur einige ausgesuchte Nutzer Genie 3 ausprobieren. Nachfolgend teilt einer von ihnen seine Erfahrungen:

Special thanks to @GoogleDeepMind for inviting me to try out Genie 3. I&m excited to share my thoughts on this early research prototype and also some of my live recordings below:

I spent the whole day playing with the system and when it works, it is truly mind blowing🤯. It is… pic.twitter.com/JPW5sPEeF5
— Tejas Kulkarni (@tejasdkulkarni) August 5, 2025

Wer mehr wissen will - hier ein rund 1-stündiges Interview mit zwei Entwicklern von Genie 3:

Genie 3 from @GoogleDeepMind is the most mind-blowing technology I&ve ever seen since starting MLST. This is our exclusive in-person interview with @jparkerholder and @shlomifruchter pic.twitter.com/k0fGNJ2cul
— Machine Learning Street Talk (@MLStreetTalk) August 5, 2025

UPDATE 7. August: Interessanterweise kann anstatt eines Prompts auch ein Video als Input für Genie 3 verwendet werden, Genie 3 ermöglicht dann die freie Navigation in der "Welt" des Videos. Damit ergibt sich die fantastische Möglichkeit, ab sofort jede beliebige Filmwelt zu "besuchen" und so zum Beispiel eine Szene seines Lieblingsfilms zu durchwandern:

Yesterday we announced Genie 3. One feature of the model that's especially fun to play with is starting worlds from existing videos. Here's a drone shot generated by Veo 3, with me taking control mid-flight. https://t.co/M4iRZEF6LR pic.twitter.com/tyBQNhLF1I
— Jakob Bauer (@jkbr_ai) August 6, 2025

mehr Infos bei
deepmind.google

Auf Socials teilen:

Leserkommentare // Neueste

[20 Leserkommentare] [Kommentar schreiben]

philr // 20:03 am 7.8.2025

Wo liegt denn da der fundamentale Unterschied zu beispielsweise den militärischen Simulationsanwendungen für Häuserkämpfe, zu Umgebungsmodellen bei autonomer Mobilität, etc...weiterlesen

Blackbox // 18:37 am 7.8.2025

Wenn Tante Erika und Onkel Hermann am STrand Federball spielen wird die 'Ki' wohl kaum das Hinterland korrekt herbeiphantasieren können. Auch die Indoor Aufnahme in der längst...weiterlesen

berlin123 // 18:17 am 7.8.2025

Wo liegt denn da der fundamentale Unterschied zu beispielsweise den militärischen Simulationsanwendungen für Häuserkämpfe, zu Umgebungsmodellen bei autonomer Mobilität, etc...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

3D-Welten aus Videoclips Googles Genie 3 ermöglicht auch das Eintauchen in Filme und Bilder

Schon für sich genommen ist Googles Weltengenerierungs-KI Genie 3 eindrucksvoll genug, doch nun ist eine weitere, auch für Filmemacher sehr interessante Fähigkeit bekannt geworden....

// 14:57 So, 10. Aug 2025von Thomas Richter

News

Editing per Prompt Google Veo am Start - neue Video-KI macht über 60 Sekunden lange Clips

Während das einstige Spitzenmodell OpenAIs Sora noch immer nicht öffentlich ist, geht der Kampf um die beste Video-KI unvermindert geht weiter - jetzt hat Google sein erstmals Mai ...

// 11:52 Fr, 6. Dez 2024von Thomas Richter

News

KI-Video Revolution reloaded Google Veo 3 vorgestellt - Die erste Video-KI mit voll integriertem Sound

Veo 3 generiert als erste Video-KI natives Audio - sowohl Sprache und Gesang, als auch Musik und Soundeffekte wie Geräusche und auch Tierlaute - alles passend zum entsprechenden .....

// 18:48 Do, 22. Mai 2025von Thomas Richter

News

Video-to-Audio KI für Veo Google DeepMind wird Videos mit automatisch erzeugter Tonspur unterlegen

Die wenigsten KI-Videogeneratoren erstellen Clips inklusive Ton - unseres Wissens bildet Pika mit sowohl Dialogen als auch Sound Effects hier die einzige Ausnahme, während OpenAI ....

// 20:01 Mi, 19. Jun 2024von blip

News

Dramatron: KI erstellt aus Plot-Prompts Drehbücher mitsamt Dialogen

Seit kurzem ist ein neues, auf dem GPT-3 Modell basierendes KI-Tool online, das bei der Erstellung von Drehbüchern helfen soll - ausgehend von einem einfachen Plot-Prompt, welches ...

// 10:36 So, 11. Dez 2022von blip

zur Newsübersicht >

Das Ende der RAW WARS Blackmagic unterstützt Apple ProRes RAW - nicht nur in Resolve

Dass es irgendwann so kommen musste, war ja fast klar, aber zwei Tage VOR dem Beginn der IBC lässt Blackmagic ziemlich überraschend eine fette Katze aus dem Sack: Das neueste ...

// 09:58 Mi, 10. Sep 2025von Rudi Schmidts

News

Profi-Videofeatures iPhone 17 Pro: ProRes RAW, Genlock, Apple Log 2 und Blackmagic ProDock für Filmer

Apple hat mit dem iPhone 17 Pro und iPhone 17 Pro Max die neueste Generation seiner Pro-iPhone Modelle vorgestellt, die Verbesserungen in den Bereichen Rechenleistung, ...

// 00:30 Mi, 10. Sep 2025von Thomas Richter

News

Direkter FX3 Konkurrent Canon Cinema EOS C50 - Vollformat kompakt mit 7K60p Open Gate RAW Aufzeichnung

Canon ergänzt seine Cinema EOS Reihe um die neue EOS C50. Als bisher kleinste Kamera der Cinema EOS Serie soll sie mit kompakter Bauform und professionellen Funktionen glänzen. ...

// 14:59 Di, 9. Sep 2025von Rudi Schmidts

Test

Neue kompakte Cine-Referenz? Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?

Mit der Nikon ZR präsentiert Nikon die heiß erwartete, erste Version seiner RED RAW Implementierung in einem kompakten Nikon-Vollformat Body. Mit einer UVP von 2.349,- Euro bei 6K ...

// 05:58 Mi, 10. Sep 2025von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Praxis

Effektives Prompting für KI-Videos mit Adobe Firefly

Einheitliche Metadaten Neue Funktionen für Frame.io verbessern Sicherheit und Sharing

Adobe hat auf der IBC 2025 neben neuen Versionen von Premiere Pro und After Effects auch eine Reihe von Neuerungen für Frame.io vorgestellt. Im Fokus stehen dabei vor allem die ...

// 09:30 So, 21. Sep 2025von Thomas Richter

News

1.800K bis 20.000K Aputure NOVA II 2x1 - 1.000W LED-Panel mit BLAIR-CG-Engine

Aputure hat auf der IBC 2025 mit dem NOVA II 2x1 ein neues LED-Hochleistungspanel vorgestellt, das auf die Nutzung bei professionellen Film- und Fernsehproduktionen abzielt. Das .....

// 10:14 Sa, 20. Sep 2025von Thomas Richter

zur Newsübersicht >

Das Holodeck ist da Google DeepMind Genie 3 - interaktive Welten in Echtzeit generieren

Konsistente interaktive Welten

Wozu?

// Top-News auf einen Blick:

Ein Schritt auf dem Weg zur AGI

Was kann Genie 3 (noch) nicht?

3D-Welten aus Videoclips Googles Genie 3 ermöglicht auch das Eintauchen in Filme und Bilder

Editing per Prompt Google Veo am Start - neue Video-KI macht über 60 Sekunden lange Clips

KI-Video Revolution reloaded Google Veo 3 vorgestellt - Die erste Video-KI mit voll integriertem Sound

Video-to-Audio KI für Veo Google DeepMind wird Videos mit automatisch erzeugter Tonspur unterlegen

Dramatron: KI erstellt aus Plot-Prompts Drehbücher mitsamt Dialogen

Das Ende der RAW WARS Blackmagic unterstützt Apple ProRes RAW - nicht nur in Resolve

Profi-Videofeatures iPhone 17 Pro: ProRes RAW, Genlock, Apple Log 2 und Blackmagic ProDock für Filmer

Direkter FX3 Konkurrent Canon Cinema EOS C50 - Vollformat kompakt mit 7K60p Open Gate RAW Aufzeichnung

Neue kompakte Cine-Referenz? Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?

Sponsored Workshop Effektives Prompting für KI-Videos mit Adobe Firefly

Sponsored Workshop KI-Tools in der Filmproduktion: Moodboards mit Adobe Firefly erstellen

Einheitliche Metadaten Neue Funktionen für Frame.io verbessern Sicherheit und Sharing

1.800K bis 20.000K Aputure NOVA II 2x1 - 1.000W LED-Panel mit BLAIR-CG-Engine

ARTIKEL

THEMEN