3D-Welten aus Videoclips Googles Genie 3 ermöglicht auch das Eintauchen in Filme und Bilder

// 14:57 So, 10. Aug 2025von

Schon für sich genommen ist Googles Weltengenerierungs-KI Genie 3 eindrucksvoll genug, doch nun ist eine weitere, auch für Filmemacher sehr interessante Fähigkeit bekannt geworden. Genie 3 kann nämlich nicht nur Welten per Text-Prompt erzeugen, sondern auch Bilder oder Videos als Startpunkt für die Erstellung von interaktiven 3D-Welten nutzen.


Google Genie 3
Google Genie 3


Ein von einem Entwickler gepostetes Beispielvideo zeigt die Aufnahmen eines Drohnenflugs, der nach rund 10 Sekunden vom User per Genie 3 übernommen wird, der dann frei weiterfliegt und nicht mehr an den Flugpfad der Originalaufnahme gebunden ist. Genie 3 generiert nicht nur nahtlos neue Bilder von Landschaftsaspekten, die noch nicht zu sehen waren, sondern scheint sich auch an die am Anfang des Videos gezeigten Details erinnern zu können - man kann sie aus einer anderen Perspektive sehen, nachdem der virtuelle Pilot eine Schleife geflogen ist.







Das eröffnet faszinierende neue Möglichkeiten, denn man kann so per Genie 3 zum Beispiel auch in ein beliebiges Gemälde oder einen Film "eintauchen" und eine bestimmte Szene samt ihrer speziellen Welten frei erkunden, wie im folgenden Beispiel in allen Stärken und Schwächen demonstriert.



Hier in Edward Hoppers berühmtes Bild "Nighthawks":





Oder ein klassisches Gemälde wie hier Jacques Louis Davids "The Death of Socrates":





Für Filmemacher könnte Genie 3 - als virtuelle Kamera genutzt - interessant sein, zum Beispiel indem Ansichten einer schon gefilmten Szene aus anderen Perspektiven generiert werden, sei es als Ergänzung schon gemachter Aufnahmen oder zum Experimentieren beim Finden der optimalen Kameraeinstellung einer Szene vor noch vor dem eigentlichen Dreh. Genie 3 bietet nochmal mehr Möglichkeiten als Runways Aleph, das die nachträgliche Bearbeitung von Videoaufnahmen erlaubt und auch neue Ansichten generieren kann, aber nicht frei navigierbar wie Genie 3, sondern nur grob per Textprompt.





Noch unklar ist, ob Genie 3 durch ein längeres Startvideo noch mehr Informationen zur (Re-)Konstruktion der Welt erhält und dies noch originalgetreuer darstellen kann. Ein Startvideo lässt sich jedenfalls kombinieren mit einem Textprompt, um die Generierung zu beeinflussen.





Man sollte bei aller Begeisterung natürlich im Kopf behalten, dass Genie 3 den klassischen Beschränkungen generativer KIs unterliegt: die auf der Basis von vorhandenen Bildern neu erzeugte Welt wird nach Wahrscheinlichkeit generiert, d.h. nach Mustern, die aus dem Trainingsmaterial extrahiert wurden. D.h. Genie 3 erstellt keine exakten Rekonstruktionen der (Film-)Wirklichkeit außerhalb des Frames, sondern - abseits vom im Quellvideo Sichtbaren - nur mögliche Umgebungen. Deswegen kann man in Genie 3 etwa nicht durch echte Städte wie in den Beispielvideos New York oder Venedig gehen, sondern in einem archetypischen New York oder Venedig - was aber für Ortsunkundige kaum vom Vorbild zu unterscheiden ist. Google selbst weist in der Sektion über die Beschränkungen des Modells darauf hin: "Genaue Darstellung realer Orte. Genie 3 ist derzeit nicht in der Lage, reale Orte mit perfekter geografischer Genauigkeit zu simulieren."




Ähnliche News //
Umfrage
    Generative Video-KI: Hast du ein Abo?







    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash