KI-Video Realismus-Check Verstehen Video-KIs die Welt? Physik-IQ enthüllt Grenzen der Modelle

// 10:36 Sa, 13. Dez 2025von Thomas Richter

Video-KIs sind rasend schnell immer besser geworden und generieren inzwischen Videos, die kaum noch von gefilmter Realität zu unterscheiden sind. Um dies zu erreichen, müssen sie allen komplexen Gesetzen der Physik bei der Darstellung von Szenen folgen: Objekte im Vordergrund verdecken Objekte im Hintergrund, manche Objekte sind transparent, Lichtbrechung, Schattenwurf, Bewegung von Flüssigkeiten usw. – ganz abgesehen von den Besonderheiten der Bewegung von belebten Objekten oder menschlichen Gesichtsausdrücken.

Die beeindruckenden Fortschritte der Video-KIs haben zu einer leidenschaftlich geführten wissenschaftlichen Debatte geführt: Lernen Videomodelle – nur anhand der Videos, mit denen sie gefüttert wurden – sogenannte „Weltmodelle“ und entdecken physikalische Gesetze, oder sind sie lediglich hochentwickelte Pixel-Vorhersagemodelle, die visuellen Realismus ohne Verständnis physikalischer Prinzipien erreichen?

Verstehen Video-KIs die Welt? Physik-IQ enthüllt Grenzen der Modelle

Eine Hauptfrage, die sich dabei aufdrängt, ist: verstehen KIs die Welt oder extrapolieren sie nur aus dem enormen Trainingsmaterial? Thema war das bereits bei der Vorstellung der ersten realistischen Video-KI, OpenAIs Sora vor anderthalb Jahren, als OpenAI begleitend den Artikel Video generation models as world simulators veröffentlichte, der in dem Satz endete: "Wir glauben, dass die heutigen Fähigkeiten von Sora zeigen, dass die fortlaufende Skalierung von Videomodellen ein vielversprechender Weg zur Entwicklung leistungsfähiger Simulatoren der physischen und digitalen Welt sowie der darin lebenden Objekte, Tiere und Menschen ist.".

The different test scenarios — Die verschiedenen Testszenarien

Ein Team von Forschern von Googles DeepMind hat vor knapp einem Jahr diesen Glauben einem Test unterzogen und untersucht, ob moderne Video-KIs wirklich physikalische Gesetze "verstehen". Dazu haben sie einen Physik-IQ genannten Benchmark entwickelt, der nur durch ein tiefes Verständnis verschiedener physikalischer Prinzipien wie Fluiddynamik, Optik, Festkörpermechanik, Magnetismus und Thermodynamik gelöst werden kann.

// Top-News auf einen Blick:

Jeder Test zeigt anhand eines echten Videos den Beginn eines Ereignisses und fordert dann eine Video-KI auf, die nächsten Sekunden vorherzusagen. Diese Vorhersage wird dann mit dem tatsächlichen Verlauf verglichen – durch Bewegungsanalysen, die prüfen, wo, wann und wie stark sich Dinge bewegen. Je nachdem, wie weit die Vorhersagen mit der Realität übereinstimmen, wird ein Physik-IQ Wert errechnet.

Die Ergebnisse zeigen, dass das physikalische Verständnis bei allen untersuchten Video-KIs (wie Sora, Runway, Pika, Lumiere, Stable Video Diffusion und VideoPoet) stark eingeschränkt ist und in keinem Zusammenhang mit dem visuellen Realismus steht.

So sind etwa die von Sora generierten Videos zwar am schwersten von echten Videos zu unterscheiden, doch die Physikbewertung des Modells ist niedrig – was zeigt, dass Realismus und physikalisches Verständnis nicht korreliert sind.

Physics IQ score of the different video AI models — Physik IQ Wert der verschiedenen Video-KI Modelle

Einige Testszenarien wurden dennoch erfolgreich gelöst und von manchen Modellen richtig vorhergesagt. Dies deutet darauf hin, dass das Erlernen bestimmter physikalischer Prinzipien allein durch Beobachtung möglich sein könnte – jedoch bestehen weiterhin erhebliche Herausforderungen. Die Forscher rechnen in naher Zukunft mit schnellen Fortschritten, aber ihre Arbeit demonstriert, dass visueller Realismus kein echtes, physikalisches Verständnis und damit ein internes Weltmodell impliziert.

mehr Infos bei
arxiv.org

Auf Socials teilen:

Leserkommentare // Neueste

dienstag_01 // 11:53 am 13.12.2025

Ich würde ja gerne mal die Videos zu den Fragestellungen sehen, habt ihr eine Quelle?

Im Forum mitdiskutieren >>

Ähnliche News //

News

Das Holodeck ist da Google DeepMind Genie 3 - interaktive Welten in Echtzeit generieren

Googles DeepMind hat Genie 3 vorgestellt, einen interaktiven Weltengenerator, der per Prompt Welten erstellt, die dann in Echtzeit über die Cursorstasten erkundet werden können - ....

// 20:27 Di, 5. Aug 2025von Thomas Richter

News

Meta setzt neue Maßstäbe Neue Video-KI Movie Gen kommt mit Killerfeature

Meta hat Movie Gen vorgestellt, ein neues KI-Modell zur Generierung von Videos, welches gleich mehrere interessante Funktionen mitbringt. Neben der Möglichkeit, hochwertige Videos ...

// 17:49 Sa, 5. Okt 2024von Thomas Richter

News

Künstler vs KIs: Neues Tool macht Kunstwerke für KIs unverdaulich

Der Boom bildgenerierender KIs, die per Prompt beliebige Bilder erzeugen, hat bei Künstlern große Ängste ausgelöst, kann doch jeder Kunst- oder Künstlerstil - egal ob Malerei, ...

// 19:51 Mo, 20. Feb 2023von Thomas Richter

News

Kampf gegen KI-Fakes Neuer Algorithmus erkennt KI-Videos mit 98% Genauigkeit

Als die ersten Videos von OpenAIs Video-KI Sora erschienen, war klar, dass demnächst - früher als erwartet - massenhaft täuschend echt aussehende Filme von KIs generiert werden ...

// 14:14 Fr, 28. Jun 2024von Thomas Richter

News

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Forscher von Google haben eine neue KI vorgestellt, die nach einem ähnlichen Muster wie die gerade sehr populären Text-2-Image KIs wie DALL-E 2, Midjourney oder Stable Diffusion .....

// 10:57 Mo, 30. Jan 2023von Thomas Richter

zur Newsübersicht >

Weihnachts-Deals 2025 Kameras, Objektive, Drohnen: Bis zu 1.530 Euro sparen bei Sony, Nikon & Co.

Wer zu Weihnachten Geschenke für andere - oder sich - sucht, kann beim Kauf von Kameras, Objektiven, Drohnen oder Equipment zum Filmen und Nachbearbeiten einiges an Geld sparen. .....

// 11:52 Mi, 10. Dez 2025von Thomas Richter

Test

Nachgefasst Sony FX3 Sensor-Test - Dynamik, Debayering und Rolling Shutter

Die Sony FX3 ist eine der wenigen relevanten Kameras, die wir bislang nicht in unserem Dynamik-Vergleichstest testen konnten - was wir hiermit endlich nachholen wollen.

// 13:51 Mi, 10. Dez 2025von Rudi Schmidts

Praxis

Nikon ZR - Cinematische Anmutung durch halbiertes Debayering mit RED RAW NE

Community-Umfrage Sony und slashCam verlosen eine FX2 Cinema Line Kamera

Weihnachten steht vor der Tür - und Sony hat ein besonderes Geschenk für die slashCam Community in Petto: Wer Glück hat, kann sich demnächst eine Sony FX2 unter den Baum legen. ...

// 22:13 Mo, 1. Dez 2025von slashCAM

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Aktuelles

Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?

Nach Bild- und Text-generierenden KIs gibt es noch weiteres Feld, in welchem gerade per künstlicher Intelligenz enorme Fortschritte gemacht werden und zwar bei der Synthese von ...

// 19:47 Mo, 6. Feb 2023von Thomas Richter

zur Artikelübersicht >

Aktuelle News //

News