Mittlerweile täuschend echt KI-Video oder echt gefilmt - wer erkennt´s? 20 Clips zum selbst testen

Wer die Entwicklung von generativen Video-KIs seit dem Anfang mitverfolgt hat, ahnte bei dem schnellen Tempo der Verbesserungen recht schnell, dass wohl eher früher als später der Punkt kommen würde, an dem per KI erzeugte Videos zum Teil nicht mehr von echten Videos zu unterscheiden sein würden. Konnte man noch vor relativ kurzer Zeit lachen über Hände mit 7 Fingern, eigenartiges Morphing und andere Seltsamkeiten von KI-Videos, ist mit den letzten Modell-Generationen klar geworden, dass diese offensichtlichen Fehler überwunden sind. Spätestens die aktuellen KI-Videomodelle wie Veo 3.1, Sora 2, Runway 4.5 und Kling 2.6 zeigten, dass sich jetzt Bilder produzieren lassen, die täuschend echt sein können.





Der Test

Der Video-KI Anbieter Runway hat jetzt einen Vergleichstest online gestellt, mit dessen Hilfe man selbst versuchen kann, KI-Videos von echt gefilmten Clips zu unterscheiden. Bei je 20 Videopaaren (eines davon echte Stock-Footage und eines KI) aus fünf populären Inhaltskategorien (Gesichter, Ganzkörperbewegungen von Menschen, Tiere, Naturszenen und städtische Umgebungen) muss man sich entscheiden, welches jeweils generiert ist. Runway hat für jedes Paar ein echtes Video als Ausgangspunkt genommen und dessen erstes Bild als Startbild für die Generierung per Bild-zu-Video mit Runway Gen-4.5 genutzt.





Angeblich sollen die Videopaare nicht Cherry-picked sein, d.h. es wurde nur ein Versuch generiert und auch nichts nachbearbeitet - echte und generierte Clips wurden auf fünf Sekunden gekürzt und in der Auflösung angepasst.



Laut Runway ist das Ergebnis eindeutig: bei einem Probelauf mit 1.000 Teilnehmern konnten nur knapp 10% in einer Mehrzahl der Fälle die KI-generierten Clips richtig identifizieren. (Als erfolgreich galt ein Teilnehmer, wenn sie eine Genauigkeit von mehr als 75% erreichten.)


Allerdings sind die Testclips wie gesagt nur 5 Sekunden kurz und die Auflösung recht gering - es werden außerdem beide Videos gleichzeitig nebeneinander abgespielt, sodass man bei der Betrachtung kaum Zeit hat, etwas genau anzusehen oder zu vergleichen. Nachdem beide Clips zweimal durchgelaufen sind, muss man entscheiden, welches man für KI-generiert hält.



Das ist in den meisten Fällen tatsächlich gar nicht einfach - die Motive sind großteils ziemlich clever gewählt (etwa pickende Tauben, ein Kamel in der Wüste, ein Smartphone in der Hand, Schneeverwehungen, Wolkenzeitraffer...), das Bildfenster klein, die Zeitspanne kurz, und KI-Generatoren vor allem bei Tieren & Natur ja unbestritten gut. Direkte Fehler haben wir aber auch bei anderen Motiven - selbst bei Menschen - nicht erkennen können (solche Sequenzen wurden natürlich garantiert aussortiert).



Doch aus diesem Testaufbau nun generell abzuleiten, dass 90% aller Zuschauer nicht mehr zwischen echt gefilmten und künstlich generierten Bildern unterscheiden können, halten wir für übertrieben. Statt dessen führt er unserer Meinung nach vor Augen, dass die Videogeneratoren nun wirklich gut geworden und definitv in der Lage sind, Clips zu erzeugen, die manchmal echt aussehen, vor allem bei kleineren Bildfenstern. Natürlich würden bei längeren Clips sehr viel eher Darstellungsfehler wie etwa Inkonsistenzen oder Morphing-Arterfakte bei der Generierung auftreten - aber für typische Videos im Netz, die schnell geschnitten sind, reicht diese Länge ja aus, um eingesetzt zu werden.



Man kann beim Test übrigens auch "schummeln" und die einzelnen Videos bildschirmgroß und im Loop ansehen, um dann anhand von besser sichtbaren Details über die Echtheit zu entscheiden (das Video per rechter Maustaste "Bild im Bild" in einem eigenen Fenster aufmachen und dann auf volle Größe des Bildschirms aufziehen, dann bekommt man auch Abspielkontrolle). So wird die richtige Wahl bei manchen Clips deutlich einfacher, jedoch nicht bei allen.





PS


Wer selbst (blind-)testen will wie gut die aktuellen Video-KIs - auch im Vergleich untereinander - sind, kann das in der Video Arena tun - dort werden in mehreren Runden jeweils die generierten Resultate zweier unterschiedlicher Video-KIs zum gleichen Prompt gezeigt und man kann entscheidenden, welcher Clip subjektiv besser ist.



Ähnliche News //
Umfrage
    Was bremst Deinen Workflow aktuell am meisten?










    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash