Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum KI-Forum

Infoseite // Google DeepMind Genie 3 - interaktive Welten in Echtzeit generieren



Newsmeldung von slashCAM:



Googles DeepMind hat Genie 3 vorgestellt, einen interaktiven Weltengenerator, der per Prompt Welten erstellt, die dann in Echtzeit durchlaufen werden können - ganz ähnlic...



Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Google DeepMind Genie 3 - interaktive Welten in Echtzeit generieren


Space


Antwort von Rick SSon:

Es versteht die Welt, weil es Sie erstellen kann? Es kann auch einfach unendlich samples haben und ne menge rechenpower um gut zu raten :D

Aber die Minions werdens wohl feiern.

Space


Antwort von TheGadgetFilms:

Das Holodeck ist was ganz anderes

Space


Antwort von philr:

Willst du die rote oder die blaue "Brille". Kurz vor der VR Matrix…

Space


Antwort von GaToR-BN:

Ich bin erstaunt... und mein Kopf rattert.

Wieviel Rechnenpower braucht das? Wer soll dafür wann und wieviel zahlen? Es werden ja riesige Summen investiert! (kommt da ein Crash wir 2000 Dot-Com-Blase?)
Braucht es in Zukunft noch Gamedesigner? Wird die P-Industrie mal wieder als Erstes am Start sein?
Wohin gehen wir damit? Was macht das mit uns als Menschheit?

Space


Antwort von philr:

GaToR-BN hat geschrieben:
Ich bin erstaunt... und mein Kopf rattert.

Wieviel Rechnenpower braucht das? Wer soll dafür wann und wieviel zahlen? Es werden ja riesige Summen investiert! (kommt da ein Crash wir 2000 Dot-Com-Blase?)
Braucht es in Zukunft noch Gamedesigner? Wird die P-Industrie mal wieder als Erstes am Start sein?
Wohin gehen wir damit? Was macht das mit uns als Menschheit?
naja also es ist glaube mitlerweile jeden! klar das man in Zukunft nicht mehr vom Job mit Eingabegeräten vorm Bildschirm leben können wird… die Konkurrenz ist der Computer selbst. Die Datenzentren die Zuckerbrg mit Meta z.b. gerade bauen möchte sind gewaltig, zumindest auf dem Papier. Daher kommt dann die Rechenpower, zumindest vorerst. Woher die Energie kommen wird ist eine andere Frage… und ob das alles so nachhaltig schlau ist nochmal ne andere. Aber naja… Menschen halt. Beste was wi rmachen können ist mehr wertvolle Lebenszeit in unserem echten Leben mit echten Menchen zu verbringen, slange man das noch so entspannt kann…

Space


Antwort von berlin123:

Wow. Sobald das leistungsfähig und bezahlbar ist, wird das neue Kategorien an Games und interaktiven Filmen bringen. Multi-User könnte besonders interessant werden. Das hat dann echt was von Matrix. Ich erstelle eine Welt, und in Echtzeit kann ich Dinge in der Welt passieren lassen, während andere sich darin bewegen. Oste man wechselt sich ab. 5 Minuten bestimme ich wie es aussieht und was passiert, danach 5 Minuten der Mitspieler.

Space


Antwort von GaToR-BN:

Wie in Ready Player one (Buch/Film)! Alle sind online in der Oasis und niemand verdient mehr Geld mit seiner Arbeit.

Wer zahlt dann die Zeche? Ein Angebot von Superreichen nur für Reiche
- und der Rest baut Wald wieder seine Kartoffeln an?

Ob das so gesellschaftlich gut geht? Ich glaube es kaum... Ich spitze schon mal meine Mistgabel!

Space


Antwort von Viteq:

Vor allem eine erfolgreiche Aktion von DeepMinds PR-Abteilung. Ist für mich reine "Vaporware".

An Weltmodellen arbeiten auch die anderen großen GenAI Player und nutzen diese, daher werden die Ergebnisse von Kling & Co immer besser.

Was soll der Nutzen von Google's Genie für FilmemacherInnen sein, wenn man nicht einigermaßen präzise steuern kann, was da auf dem Screen auftaucht ?
Man kann jede Menge witzigen AI Slop mit so etwas produzieren, aber dafür zahlt so gut wie kein Kunde.

Space



Space


Antwort von berlin123:

Viteq hat geschrieben:

Was soll der Nutzen von Google's Genie für FilmemacherInnen sein, wenn man nicht einigermaßen präzise steuern kann, was da auf dem Screen auftaucht ?
Mit zunehmender Zeit wird man KI immer besser steuern können. Nicht nur dadurch, dass geschriebene Anweisungen präziser interpretiert werden.

Auch dadurch, dass man Bild- und Videomaterial als Vorgabe gibt.

Space


Antwort von philr:

berlin123 hat geschrieben:
Viteq hat geschrieben:

Was soll der Nutzen von Google's Genie für FilmemacherInnen sein, wenn man nicht einigermaßen präzise steuern kann, was da auf dem Screen auftaucht ?
Mit zunehmender Zeit wird man KI immer besser steuern können. Nicht nur dadurch, dass geschriebene Anweisungen präziser interpretiert werden.

Auch dadurch, dass man Bild- und Videomaterial als Vorgabe gibt.
Vorallem sprach prompt…Wenn du aktuell mit Google Imagen sprichst und nur Orte erwähnst und beschreibst trifft es das schon ziemlich präzise… die haben ja auch irgendwann mal die halbe Welt angefangen zu scannen…

Space


Antwort von Blackbox:

philr hat geschrieben:
Beste was wi rmachen können ist mehr wertvolle Lebenszeit in unserem echten Leben mit echten Menchen zu verbringen, slange man das noch so entspannt kann…
Du gehst wirklich davon aus, dass Bio-Menschen künftig gegen die Ki-Konkurrenz bestehen können?
Partner/Partnerin lässt sich doch optisch sicher bald gut prompten und mit realistischem Silikon 3D Druck alteresresistent ins Haus zustellen.
Wenn's dann doch mal fade werden sollte, lässt sich ja jederzeit ein Konversations Update und/oder ein Upgrade für intensivere körperliche Fähigkeiten aufspielen ...

Space


Antwort von tom:

Interessanterweise kann anstatt eines Prompts auch ein Video als Input für Genie 3 verwendet werden - Genie 3 ermöglicht dann die freie Navigation in der "Welt" des Videos. Damit ergibt sich die fantastische Möglichkeit, jede beliebige Filmwelt zu "besuchen" und so zum Beispiel eine Szene seines Lieblingsfilms zu durchwandern:

<blockquote class="twitter-tweet" data-media-max-width="560"><p lang="en" dir="ltr">Yesterday we announced Genie 3. One feature of the model that&#39;s especially fun to play with is starting worlds from existing videos. Here&#39;s a drone shot generated by Veo 3, with me taking control mid-flight. <a href="https://t.co/M4iRZEF6LR">https://t.co/M4iRZEF6LR</a> <a href="https://t.co/tyBQNhLF1I">pic.twitter.co ... </p>&mdash; Jakob Bauer (@jkbr_ai) <a href="https://twitter.com/jkbr_ai/status/1953 ... fw">August 6, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>

Space


Antwort von Blackbox:

Ist das denn wirklich so neu?
In den Bereichen Medizin und Militär gibt's die diversen Simulations-/Explorationsmöglichkeiten doch schon seit Längerem?
Von Flugsimulatoren und dergleichen mal ganz abgesehen.
Oder bei der Zeitenwende Technik: Taurus und Co. haben doch längst realistische 'Weltabbilder' in ihrer Zielprogrammierung integriert.
Gerade in den USA lässt sich gut beobachten, wie Entertainment und Kriegstechnologie in inniger Synthese entwickelt werden.
Sind ja langsam wie siamesische Zwillinge, auch was die finanzielle Integration der IT-Konzerne in den militärisch-industriellen Komplex angeht.

Space


Antwort von philr:

Blackbox hat geschrieben:
Ist das denn wirklich so neu?
In den Bereichen Medizin und Militär gibt's die diversen Simulations-/Explorationsmöglichkeiten doch schon seit Längerem?
Von Flugsimulatoren und dergleichen mal ganz abgesehen.
Oder bei der Zeitenwende Technik: Taurus und Co. haben doch längst realistische 'Weltabbilder' in ihrer Zielprogrammierung integriert.
Gerade in den USA lässt sich gut beobachten, wie Entertainment und Kriegstechnologie in inniger Synthese entwickelt werden.
Sind ja langsam wie siamesische Zwillinge, auch was die finanzielle Integration der IT-Konzerne in den militärisch-industriellen Komplex angeht.
Ich glaube du hast das nicht ganz verstanden

Space


Antwort von Blackbox:

Ja, das mag durchaus so sein, zumal ich sicherlich nicht zum kleinen erlauchten Kreis der 'Ki-Versteher' gehöre, oder aber es wird allgemein immer noch stark unterschätzt wie groß der technologische Vorsprung an der 'Front', dem Militär, gegenüber den zivilen Anwendungen und Ablegern eigentlich ist?
Lückenhafte Daten mit 'phantasierten' auf Wahrscheinlichkeiten beruhenden 'Ki'-Ergänzungen aufzufüllen ist doch bei automatisierter Zielerfassung, autonomer Flugroutenwahl usw. essentiell, und das ist ja nicht weit weg vom 'Durchwandern' Ki-ergänzter Filmsets.
Da das Militär mittlerweile ganz offiziell 'kognitiv warfare' auf die Agenda geschrieben hat, wächst auch Ki-generierter AV-content - teils ja schon von Bots entwickelt und eingestellt - tendenziell immer stärker in den militärischen Bereich hinein (oder ist daraus erwachsen?).
Gerade das Verschwimmen lassen von Realität und fake-generierung ist dabei feature und nicht bug.
Klassisch 'dual use' sozusagen.
Neu ist natürlich auch das nicht:
https://en.wikipedia.org/wiki/Military% ... nt_complex

Space


Antwort von Viteq:

Tom, Danke für deine Mühe kompetent mit wirklich wertvollem Content zu antworten !

Ist den Lesern eigentlich klar was es bedeutet, wenn das wirklich funktioniert ?
Das ist fast so, als ob man alles mit 360-Grad Kameras vollstellt und sich dann am PC beliebige Einstellungen mitsamt Kamerabewegungen ausdenken kann und dann alles in Echtzeit zusammen gestitcht wird (wobei die Kameras und das Team auch noch unsichtbar bleiben).

Das finde ich für die Filmindustrie wesentlich wichtiger als die ursprüngliche Meldung mit den Spielwelten.

Jetzt fehlen nur noch Releasedatum und Preismodell ...
tom hat geschrieben:
Interessanterweise kann anstatt eines Prompts auch ein Video als Input für Genie 3 verwendet werden - Genie 3 ermöglicht dann die freie Navigation in der "Welt" des Videos. Damit ergibt sich die fantastische Möglichkeit, jede beliebige Filmwelt zu "besuchen" und so zum Beispiel eine Szene seines Lieblingsfilms zu durchwandern:
<a href="https://twitter.com/jkbr_ai/status/1953 ... 0264067</a>


Space


Antwort von Blackbox:

Wo liegt denn da der fundamentale Unterschied zu beispielsweise den militärischen Simulationsanwendungen für Häuserkämpfe, zu Umgebungsmodellen bei autonomer Mobilität, etc.?
Und wo ist der Unterschied zu bestehenden Verfahren der Datenergänzung durch Wahrscheinlichkeitsannahmen auf Basis eines jeweiligen (noch unvollständigen) sogenannten 'Weltmodells'?
Mir scheint, das ist nur ein weiterer und zu erwartender Evolutionsschritt der Umsetzung von ggf. unvollständigen 2d Daten in eine physikalisch und räumlich weitgehend konsistente virtuelle 3D 'Welt'.
Übersehe ich da was 'Revolutionäres'?

Space



Space


Antwort von berlin123:

Blackbox hat geschrieben:
Wo liegt denn da der fundamentale Unterschied zu beispielsweise den militärischen Simulationsanwendungen für Häuserkämpfe, zu Umgebungsmodellen bei autonomer Mobilität, etc.?
Und wo ist der Unterschied zu bestehenden Verfahren der Datenergänzung durch Wahrscheinlichkeitsannahmen auf Basis eines jeweiligen (noch unvollständigen) sogenannten 'Weltmodells'?
Mir scheint, das ist nur ein weiterer und zu erwartender Evolutionsschritt der Umsetzung von ggf. unvollständigen 2d Daten in eine physikalisch und räumlich weitgehend konsistente virtuelle 3D 'Welt'.
Übersehe ich da was 'Revolutionäres'?
Was beim Militär in verschlossenen Räumen heute geht weiss ich nicht. Wenn es jemand wüsste, würde er es hier vermutlich nicht preisgeben.

Aber ich würde auch nicht immer davon ausgehen, dass das Militär Firmen wie Google voraus ist. Die Innovations Power bei Big Tech ist schon enorm. Jedenfalls wird diese Technologie hier erstmals mit der Öffentlichkeit geteilt.
Blackbox hat geschrieben:
Übersehe ich da was 'Revolutionäres'?
Das revolutionäre sind meiner Meinung nach die sichständig verbessernde Qualität der Video Ki Modelle allgemein. Und ausserdem der Echtzeit- und der Interaktivitäts-Aspekt.

Wer sich erinnert: mit Bryce von Kai's PowerTools konnte man als Nicht-Profi in den 90ern auch coole Landschaften erstellen. Aber das sah immer gleich aus.

Ein Profi macht heute mit 3D Tools und Game Engines natürlich wahnsinnige Sachen. Aber es erfordert lange Einarbeitung.

Die Echtzeit Performance beim Wandern durch eine Unreal Welt ist beeindruckend. Die Erstellung derselben dauert aber.

Wenn diese KI Engine ausgereift ist, kann jeder in kurzer Zeit beliebige Welten bauen. Wofür Previs-Profis und 3D Artists Stunden und Tage brauchten, macht jeder künftig in wenigen Minuten.

Alleine was Rob da beschrieben hat mit dem Video als Basis ist doch Wahnsinn. Man kann zum Beispiel ein Super 8 Video der Eltern aus den 70ern nehmen und sich in Echtzeit durch die dort gezeigte Welt bewegen.

Space


Antwort von Blackbox:

Wenn Tante Erika und Onkel Hermann am STrand Federball spielen wird die 'Ki' wohl kaum das Hinterland korrekt herbeiphantasieren können. Auch die Indoor Aufnahme in der längst abgerissenen Hotellobby wird keinen Rundgang durchs ganze Hotel erlauben, es sei denn der 'Ki' gelingt eine Geolokalisierung und sie findet in den Google Datenbanken alte Baupläne oder Fotodokumente, etc. was aber heutzutage noch unrealistische hohe Rechenleistungen erfordert (vom meist fehlenden Datenbestand mal abgeseheh).
Klar, wenn ein Raum in näherungsweise Rundumsicht oder eine Gegend aus genügend diversen Blickwinklen auf super8 oder Video oder Dia/Foto festgehalten ist, wird das Umrechnen in 3D wohl funktionieren, ebenso wie es bereits leidlich gut funktioniert aus einem einzigen 2D Foto automatisch ein halbwegs stimmiges 3D Modell kreieren bzw. erraten zu lassen. Stitching plus Perspektive/Raumtiefe plus relativ stimmiges Erraten von Fehlendem sozusagen.

Vielleicht traue ich der 'Ki' auch einfach nur im Generellen zu viel zu, so dass ich über eigentlich überraschende Dinge dann nicht angemessen überrascht bin?

Space


Antwort von philr:

berlin123 hat geschrieben:
Blackbox hat geschrieben:
Wo liegt denn da der fundamentale Unterschied zu beispielsweise den militärischen Simulationsanwendungen für Häuserkämpfe, zu Umgebungsmodellen bei autonomer Mobilität, etc.?
Und wo ist der Unterschied zu bestehenden Verfahren der Datenergänzung durch Wahrscheinlichkeitsannahmen auf Basis eines jeweiligen (noch unvollständigen) sogenannten 'Weltmodells'?
Mir scheint, das ist nur ein weiterer und zu erwartender Evolutionsschritt der Umsetzung von ggf. unvollständigen 2d Daten in eine physikalisch und räumlich weitgehend konsistente virtuelle 3D 'Welt'.
Übersehe ich da was 'Revolutionäres'?
Was beim Militär in verschlossenen Räumen heute geht weiss ich nicht. Wenn es jemand wüsste, würde er es hier vermutlich nicht preisgeben.

Aber ich würde auch nicht immer davon ausgehen, dass das Militär Firmen wie Google voraus ist. Die Innovations Power bei Big Tech ist schon enorm. Jedenfalls wird diese Technologie hier erstmals mit der Öffentlichkeit geteilt.
Blackbox hat geschrieben:
Übersehe ich da was 'Revolutionäres'?
Das revolutionäre sind meiner Meinung nach die sichständig verbessernde Qualität der Video Ki Modelle allgemein. Und ausserdem der Echtzeit- und der Interaktivitäts-Aspekt.

Wer sich erinnert: mit Bryce von Kai's PowerTools konnte man als Nicht-Profi in den 90ern auch coole Landschaften erstellen. Aber das sah immer gleich aus.

Ein Profi macht heute mit 3D Tools und Game Engines natürlich wahnsinnige Sachen. Aber es erfordert lange Einarbeitung.

Die Echtzeit Performance beim Wandern durch eine Unreal Welt ist beeindruckend. Die Erstellung derselben dauert aber.

Wenn diese KI Engine ausgereift ist, kann jeder in kurzer Zeit beliebige Welten bauen. Wofür Previs-Profis und 3D Artists Stunden und Tage brauchten, macht jeder künftig in wenigen Minuten.

Alleine was Rob da beschrieben hat mit dem Video als Basis ist doch Wahnsinn. Man kann zum Beispiel ein Super 8 Video der Eltern aus den 70ern nehmen und sich in Echtzeit durch die dort gezeigte Welt bewegen.
Ich weiß nicht, worauf er hinaus will… beim Militär werden manchmal zum Training von Soldaten VR anwednungen genutzt, die basieren auf Unity oder Unreal Anwednungen die ganz simpel in Game Engines manuell erstellt werden, dass auf vorgebenen Physikalischen angaben in Physik libaries etc im Code basieren… das hat aber alles! nichts mit einer AI Worldmodell zu tun… ein World modell ist etwas ganz anderes, das ist die möglichkeit für neuronalen deep learning Netzen aufgebauten System physik zu verstehen und selbst zu gestalten… vereinfacht geschrieben… Militär weiß nicht mmer mehr als die Zivilwirtschaft, das ist etwas alberner Kontext und Aberglauben… Das einzigste was dass Militär mehr nutzt sind spezielle sehr teure entwicklungen die dann aber auch von Firmen wie Palantir etc. kommen… das basiert aber auch alles auf den selben Stand der "Wissenschaft"… alles andere ist Schwurbel gele…

Space


Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum KI-Forum

Antworten zu ähnlichen Fragen //


Odyssey Explorer: Gaußsche Splats generieren fotorealistische 3D-Welten für Unreal, Blender & Co.
Google DeepMind Veo erzeugt 1080p-Clips mit verbesserter Konsistenz
Google DeepMind wird Videos mit automatisch erzeugter Tonspur unterlegen
Syrp Genie Micro: intelligente Fernbedienung für Spiegelreflex- und DSLM-Kameras
SLATE: digitale Filmklappe aus E-Paper - das beste aus zwei Welten?
Googles Genie 3 ermöglicht auch das Eintauchen in Filme und Bilder
Google schaltet Google Drive Sync für Blackmagic Cloud ab.
MuZero: Googles DeepMind KI wird Videokompression für YouTube optimieren
Kleine Vorschauvideos im Batch generieren?
Rohschnitt aus Transkript generieren - Text-basiertes Editing in Premiere Pro (Beta)
Adobe arbeitet an KI-Tool zum Generieren und Editieren von Musik
Gezielter generieren - Runway Gen3 animiert jetzt auch Bilder
ElevenLabs Video-to-Music - automatisch Soundtracks zu Videos per KI generieren
KI-Styletransfer für Video jetzt auch interaktiv in Echtzeit
Frame.io Camera to Cloud: Cloud-basierter Echtzeit-Workflow von der Kamera bis zum Schnitt
Adobe After Effects 18.0 Update bringt Echtzeit-3D-Entwurfsvorschau und Multi-Frame Rendering
Frame.io startet Cloud-basierten Echtzeit-Workflow von der Kamera bis zum Schnitt




slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash