W.A.L.T. - Google zeigt neues KI-Videomodell mit sehr guter Konsistenz

// 11:13 Di, 12. Dez 2023von Rudi Schmidts

W.A.L.T. bei Bewegtbildern steht nicht mehr nur für Disney sondern für einen transformerbasierten Ansatz zur fotorealistischen KI-Videoerzeugung mittels Diffusionsmodellierung.

Googles neues Modell für generative KI-Videos beruht auf zwei Säulen: Einem einheitlichen Latent Space, der mit Bildern UND Videos trainiert wurde. Und einem Attention-Mechanismus, der nicht nur örtliche (spatiale), sondern auch zeitliche (spatiotemporale) Tokens verarbeitet.

Sehr vereinfacht gesprochen: Zeit, bzw Zeitpunkte werden bei diesem Modell ebenfalls zu Lern-Parametern. Dies ermöglicht W.A.L.T. in der ersten Version eine Text-zu-Video-Generierung mit einer Auflösung von 512 x 896 bei 8 Bildern pro Sekunde.

W.A.L.T. - Photorealistic Video Generation with Diffusion Models

// Top-News auf einen Blick:

Auch wenn die Erwartungshaltung für KI-generiertes Video mittlerweile extrem hoch ist - die hier gezeigten Demo-Clips sind nicht wirklich fotorealistisch - zumindest nicht in einem professionellen Sinn. Dennoch zeigen die Clips gegenüber bisherigen SOTA (State-Of-The-Art)-Modellen ein paar Eigenschaften, die es in dieser Art bislang noch nicht zu bestaunen gab.

So sind die gezeigten Videos von beeindruckender zeitlicher Konsistenz und können dabei schon relativ komplexe Bewegungsabläufe teilweise fehlerfrei wiedergeben. Auch Randmotive und Hintergründe sind nur von wenigen unbeabsichtigten Veränderungen geplagt.

Kurz gesagt, es handelt sich vielleicht nicht um einen Meilenstein, aber immerhin um einen weiteren soliden Schritt in Richtung fotorealistische KI-Videogenerierung.

Um sich selbst eine Meinung über W.A.L.T. bilden zu können, hat Google eine eigene Webseite mit Sample-Videos ins Netz gestellt - die natürlich nur die gelungensten Ergebnisse des W.A.L.T.-Modells offenlegt. Aber das ist bei Präsentationen von anderen, konkurrierenden KI-Modellen ja ebenso der Fall. Man darf sich also durchaus ein paar Minuten Zeit nehmen und berechtigt über die neuen Ergebnisse staunen..

mehr Infos bei
walt-video-diffusion.github.io

Auf Socials teilen:

Leserkommentare // Neueste

Kommentieren >>

Ähnliche News //

News

Rabattaktion und mehr Atomos bringt neue Funktionen per Firmware-Upgrades für Ninja Phone und Shinobi II

Zur IBC 2024 hat Atomos kostenlose Firmware-Upgrades veröffentlicht, die Verfügbarkeit seines Sun Dragon LED-Lichtbandes bekannt gegeben sowie eine befristete Rabattaktion für ...

// 16:54 So, 15. Sep 2024von Thomas Richter

News

Neue Funktionalität Kostenloses AtomOS Update bringt SRT Streaming und Fujifilm F-LOG2

Atomos hat kürzlich die neue Version 11.06.00 des AtomOS Betriebssystems für seine Ninja- und Shinobi-Serie von mobilen Recodern/Monitoren veröffentlicht, welche einige neue ...

// 09:50 Di, 14. Mai 2024von Thomas Richter

News

Alternder Actioncam-Star Aufstieg und Fall von GoPro

Wer erinnert sich noch an die Zeit, als GoPro in aller Munde war? Diese Zeiten sind lang vorbei. Golem hat in einem interessanten Artikel die sehr wechselhafte Geschichte von ...

// 09:59 Sa, 18. Mai 2024von Thomas Richter

News

126 Grad Bildwinkel Laowa: Neue verzerrungsfreie Superweitwinkel-Objektive für DJI Drohnen

Anders als bei DJIs populären Consumer-Drohnen wie der Mavic oder der Mini lassen sich mit DJIs professionelle Drohnen aufgrund ihres (proprietären) DL-Mounts auch Wechseloptiken ....

// 17:47 Mo, 13. Mai 2024von Thomas Richter

News

6K bzw. 8K 60p RAW Video Canon EOS R1 und R5 Mark II vorgestellt mit DIGIC Accelerator und mehr

Gleich zwei neue Spitzenmodelle für sein EOS R-System präsentiert Canon heute - die EOS R1 und EOS R5 Mark II bringen beide verbesserte Autofokus-Fähigkeiten sowie eine erweiterte ...

// 12:05 Mi, 17. Jul 2024von blip

zur Newsübersicht >

KI Funktionen kostenpflichtig Affinity Photo, Designer und Publisher ab sofort in einer kostenlosen App

Wie von uns bereits vor drei Wochen vermutet stellt Affinity ab sofort seine gesamte Suite für Mac und PC kostenlos zur Verfügung. Damit gibt es nun eine sehr potente ...

// 19:41 Do, 30. Okt 2025von Rudi Schmidts

News

Vorerst nur in China DJI Neo 2 bringt Rundum-Hinderniserkennung samt LiDAR

Wie vorhergesagt und geteasert, hat DJI soeben die neue intelligente 4K-Selfie-Drohne Neo 2 offiziell vorgestellt - ungewöhnlicherweise aber nicht weltweit, sondern - wohl vorerst ...

// 17:40 Do, 30. Okt 2025von Thomas Richter

News

Schneller als M3 Ultra? Künftige Xbox Next: Vollwertiger Windows-PC mit Potenzial für Videobearbeitung

Laut sich verdichtender Gerüchte und Berichte, unter anderem von den bekannten Quellen Moore&s Law Is Dead und Windows Central, plant Microsoft eine fundamentale Neuausrichtung ...

// 11:03 Mi, 29. Okt 2025von Rudi Schmidts

Test

Mobiles Filmen iPhone 17 Pro Max im Praxistest: ProRes RAW, Apple Log 2 - inkl. DJI Osmo Pocket Vergleich

Mit dem iPhone 17 Pro Max präsentiert Apple seinen neuesten Smartphone-Boliden und dies mit einer ganzen Reihe von spannenden Upgrades für mobile Video-User: Erstmalig steht eine ...

// 12:20 Mi, 22. Okt 2025von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Test

Pro Gimbal System DJI RS4 Pro und LiDAR: Bestes AF/Tracking (inkl. Stabilisierung) für Cine-Setups?

Wir hatten Gelegenheit den neuen DJI RS4 Pro Gimbal im Verbund mit DJIs LiDAR System zu testen und waren vor allem an der Autofokus- und Tracking Performance im Cine-Setup mit ...

// 16:02 Mo, 6. Mai 2024von Rob

Test

Mobile Medienproduktion Sony FX3, MacBook Air M3, Panasonic S5IIX, SmallRig DH10 Stativkopf: Was hat sich mobil bewährt?

Interview-/ Reportageequipment für den Einsatz ins (entferntere) Ausland zu transportieren und dann Vor-Ort für Produktionen zu nutzen, stellt einen echten Härtetest für das ...

// 10:52 Do, 16. Mai 2024von Rob

zur Artikelübersicht >

Aktuelle News //

News

Open-Source-Projekt Graphite - kostenloser Grafik-Editor von Photoshop bis Motion

Wir berichteten ja gerade erst über die neue kostenlose Affinity Suite, welche eine potente Bildbearbeitung, einen Vektorgrafik-Editor sowie sogar eine komplette Publishing-...

// 14:59 Sa, 1. Nov 2025von Rudi Schmidts

News

MAX Sneak Previews Woran arbeitet Adobe? Experimentelle KI-Tools für Video und Audio

Ein wiederkehrender Programmpunkt der Adobe MAX sind die Sneak Previews auf experimentelle KI-Tools, die aktuell in Entwicklung sind. Einige davon landen später im offiziellen ...

// 14:00 Fr, 31. Okt 2025von blip

zur Newsübersicht >