KI Video Generator Vidu - die chinesische Antwort auf OpenAI Sora?

// 12:56 Do, 2. Mai 2024von Rudi Schmidts

Das chinesische Technologieunternehmen ShengShu-AI und die Tsinghua-Universität haben am Wochenende ein KI-Video-Modell vorgestellt, welches nach nach eigenen Angaben mit Open AIs Sora auf Augenhöhe agieren kann.

Das Vidu getaufte Modell wurde auf dem gerade beendeten Zhongguancun-Forum in Peking vorgestellt und kann mit einem Klick aus einem Text Prompt einen 16-sekündigen 1080P-Videoclip erstellen.

Platzhalter — KI Video Modell "Vidu" aus China

Es basiert laut den Entwicklern auf einer visuellen Transformationsmodellarchitektur namens Universal Vision Transformer (U-ViT), die zwei Text-zu-Video-KI-Modelle (Diffusion und Transformer) kombiniert.

Diese U-ViT Kombination ist dem Sora-Modell grundsätzlich ähnlich und wurde im September 2022 vom Vidu-Forschungsteam begonnen- also noch weit bevor OpenAI mit Sora offiziell seine ersten Ergebnisse von der Kombination aus Diffusion und Transformern der Öffentlichkeit präsentierte.

// Top-News auf einen Blick:

„Nach der Veröffentlichung von Sora stellten wir fest, dass es eng mit unserer technischen Roadmap übereinstimmte, was uns noch mehr motivierte, unsere Forschung entschlossen voranzutreiben“, sagt hierzu Zhu Jun, Vizedekan des Instituts für Künstliche Intelligenz an der Tsinghua-Universität und leitender Wissenschaftler von ShengShu- AI.

Die Ergebnisse wirken auf den ersten Blick zwar ziemlich gut, jedoch hat bislang OpenAI bei der Veröffentlichung seiner besonders gelungenen Clip-Perlenen noch definitiv die Nase vorne.

Dennoch darf auch nicht vergessen werden, dass Vidu nun gerade einmal zwei Monate nach Sora das Licht der Welt erblickt, und damit zeigt, dass OpenAI mit Sora kein technologisches Alleinstellungsmerkmal besitzt. Während der erste Vidu Live Demo zeigte ShengShu-AI, wie Vidu die reale physische Welt simulieren und Szenen mit komplexen Details im Einklang mit realen physikalischen Gesetzen erzeugen konnte. Was belegt, dass auch hier eine gewisse Weltkenntnis bei der Generierung von Szenen vorhanden sein muss.

mehr Infos bei
www.shengshu-ai.com

Auf Socials teilen:

KI Video Generator Vidu - die chinesische Antwort auf OpenAI Sora?

// Top-News auf einen Blick:

Video-KI jetzt zugänglich OpenAI gibt Sora frei - Preis: 20 oder 200 Dollar pro Monat

Generative KI-Videos 60 Sekunden Clips und konsistente Charaktere - OpenAI Sora vor der Veröffentlichung?

Video-KIs im Vergleich Wer ist besser? Sora vs Kling vs Runway Gen3 vs Luma AI

Bessere Objektkonsistenz Vidu 1.5 generiert Videoclips aus bis zu 3 vorgegebenen Bildinhalten

Text-zu-Video auf neuem Niveau OpenAI Sora - das ist der KI-Video Gamechanger!

Drahtlose Biometrie WhoFi - Neue KI kann Personen nur per WLAN-Signal identifizieren

4K XDCAM-Henkelmann Sony PXW-Z300 3-Chip-Camcorder vorgestellt mit V-Mount, KI, C2PA

Timeline-Compositing DaVinci Resolve 20 Workshop - AI Depth Map unkompliziert für Titel-Effekte nutzen

Günstiges Speicher-Upgrade Externe USB4 SSD als Mac Systemplatte nutzen - am Beispiel der Corsair EX400U

Paradigmenwechsel KI Google Veo 2 zeigt neue Perspektiven für die Videoproduktion

Teurer, doch voller Chancen Zukunft AI-Video - Wohin generative KI die Medienbranche führen wird

Drahtlose Biometrie WhoFi - Neue KI kann Personen nur per WLAN-Signal identifizieren

Verdoppelte Kapazität Neues Blackmagic Design Media Module 16 TB für URSA Cine Kameras

ARTIKEL

THEMEN