Das chinesische KI-Unternehmen Kling AI hat mit Video O1 ein neues Modell vorgestellt, welches das weltweit erste vereinheitlichte System für Videogenerierung und -bearbeitung sein soll. Es fasst dabei Funktionen, die bisher oft separate Tools erforderten, in einer einzigen Architektur zusammen. Beispielsweise kann ein Nutzer in einem einzigen Befehl eine Hauptperson hinzufügen, den Hintergrund ändern und den visuellen Stil des Videos anpassen.

Video O1 ist darauf ausgelegt, verschiedene Eingabetypen parallel zu interpretieren. Es kann bis zu sieben verschiedene Elemente wie Referenzbilder, Videoclips, isolierte Subjekte und Textanweisungen kombinieren, um daraus ein konsistentes Ergebnis zu generieren. Für die Bearbeitung bestehender Videos bedeutet dies, dass Nutzer durch Befehle wie "Entferne die Passanten" oder "Wechsle von Tag- zu Nachtaufnahme" Änderungen vornehmen können, ohne manuell Objekte maskieren oder Keyframes setzen zu müssen. Auch die Änderung von Kameraperspektiven scheint gut zu funktionieren.
Wie man sich die Bedienung vorstellen darf, zeigt das folgende Demo-Video:
Das System ist darauf trainiert, die hochgeladenen Elemente – seien es Charaktere, Objekte oder ganze Szenen – zu verstehen und über die gesamte Videolänge hinweg konsistent beizubehalten. Auf diese lässt sich dann mit dem Prompt über Tags Bezug nehmen.
// Top-News auf einen Blick:
- Sony Alpha 7 V ist da: 33MP Partially Stacked Sensor, 4K 60p ohne Crop und 16 Stops
- ByteDance Vidi2 produziert selbstständig fertige Videos aus Rohmaterial
- Blackmagic DaVinci Resolve 20.3 bringt Support für 32K-Workflows und mehr
- Bis zu 1.000 Euro sparen: Cashbacks auf Kameras von Sony, Nikon, Canon und Panasonic
- Sony und slashCam verlosen eine FX2 Cinema Line Kamera
- DJI Neo 2: Verbesserte Mini-Drohne für Solo-Creator und Einsteiger
Laut Kling AI basiert die Technologie auf einer Transformer-Architektur und einer eigens entwickelten "Multimodalen Visual Language" (MVL), die als Schnittstelle zwischen textuellen und visuellen Signalen dient. Durch den Einsatz von Reasoning-Ketten soll das Modell in der Lage sein, Ereignisse logisch abzuleiten und dadurch über eine reine Mustererkennung hinauszugehen.
In eigenen Tests verglich Kling AI Video O1 mit zwei prominenten Konkurrenzprodukten: Bei der Generierung von Videos aus Bildreferenzen soll das Modell Google Veo 3.1 deutlich übertroffen haben. In einer anderen Testreihe für Videotransformationen wurde es in der Mehrheit der Fälle der Lösung von Runway Aleph vorgezogen. Diese positiven Ergebnisse stammen jedoch ausschließlich aus internen Evaluierungen des Unternehmens und wurden noch nicht durch unabhängige, externe Benchmarks bestätigt oder widerlegt.
Die Cherry-Picked Demos sehen jedenfalls gut aus:
Video O1 ist bereits über die Webplattform von Kling AI verfügbar. Nahezu zeitgleich hat Runway mit "Gen-4.5" ebenfalls ein leistungsstarkes Nachfolgemodell vorgestellt.
Wer beim Fachhändler Teltec für mindestens 1.000 Euro (netto) einkauft, kann 25 Euro sparen mit dem Gutscheincode SLASHCAM25, ab einem Mindestbestellwert von 2.000 Euro netto mit dem Code SLASHCAM60 sogar 60 Euro - der Code ist kombinierbar sonst schon rabattierten Artikeln.




















