Mehr Konsistenz Kling Video O1 - Multimodales Modell für generative und editierende Video-KI

// 12:53 Mi, 3. Dez 2025von

Das chinesische KI-Unternehmen Kling AI hat mit Video O1 ein neues Modell vorgestellt, welches das weltweit erste vereinheitlichte System für Videogenerierung und -bearbeitung sein soll. Es fasst dabei Funktionen, die bisher oft separate Tools erforderten, in einer einzigen Architektur zusammen. Beispielsweise kann ein Nutzer in einem einzigen Befehl eine Hauptperson hinzufügen, den Hintergrund ändern und den visuellen Stil des Videos anpassen.


Kling Video O1 - Multimodales Modell für generative und editierende Video-KI


Video O1 ist darauf ausgelegt, verschiedene Eingabetypen parallel zu interpretieren. Es kann bis zu sieben verschiedene Elemente wie Referenzbilder, Videoclips, isolierte Subjekte und Textanweisungen kombinieren, um daraus ein konsistentes Ergebnis zu generieren. Für die Bearbeitung bestehender Videos bedeutet dies, dass Nutzer durch Befehle wie "Entferne die Passanten" oder "Wechsle von Tag- zu Nachtaufnahme" Änderungen vornehmen können, ohne manuell Objekte maskieren oder Keyframes setzen zu müssen. Auch die Änderung von Kameraperspektiven scheint gut zu funktionieren.



Wie man sich die Bedienung vorstellen darf, zeigt das folgende Demo-Video:






Das System ist darauf trainiert, die hochgeladenen Elemente – seien es Charaktere, Objekte oder ganze Szenen – zu verstehen und über die gesamte Videolänge hinweg konsistent beizubehalten. Auf diese lässt sich dann mit dem Prompt über Tags Bezug nehmen.


Laut Kling AI basiert die Technologie auf einer Transformer-Architektur und einer eigens entwickelten "Multimodalen Visual Language" (MVL), die als Schnittstelle zwischen textuellen und visuellen Signalen dient. Durch den Einsatz von Reasoning-Ketten soll das Modell in der Lage sein, Ereignisse logisch abzuleiten und dadurch über eine reine Mustererkennung hinauszugehen.



In eigenen Tests verglich Kling AI Video O1 mit zwei prominenten Konkurrenzprodukten: Bei der Generierung von Videos aus Bildreferenzen soll das Modell Google Veo 3.1 deutlich übertroffen haben. In einer anderen Testreihe für Videotransformationen wurde es in der Mehrheit der Fälle der Lösung von Runway Aleph vorgezogen. Diese positiven Ergebnisse stammen jedoch ausschließlich aus internen Evaluierungen des Unternehmens und wurden noch nicht durch unabhängige, externe Benchmarks bestätigt oder widerlegt.



Die Cherry-Picked Demos sehen jedenfalls gut aus:








Video O1 ist bereits über die Webplattform von Kling AI verfügbar. Nahezu zeitgleich hat Runway mit "Gen-4.5" ebenfalls ein leistungsstarkes Nachfolgemodell vorgestellt.


Mit einem Einkauf bei unseren Partnern unterstützt Du slashCam // Affiliate

Aktion
slashCam Teltec Gutschein-Codes
Wer beim Fachhändler Teltec für mindestens 1.000 Euro (netto) einkauft, kann 25 Euro sparen mit dem Gutscheincode SLASHCAM25, ab einem Mindestbestellwert von 2.000 Euro netto mit dem Code SLASHCAM60 sogar 60 Euro - der Code ist kombinierbar sonst schon rabattierten Artikeln.

Preisvergleich

Ähnliche News //
Umfrage
    Generative Video-KI: Hast du ein Abo?







    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash