Bessere Objektkonsistenz Vidu 1.5 generiert Videoclips aus bis zu 3 vorgegebenen Bildinhalten

// 19:18 Do, 14. Nov 2024von blip

Das KI-Modell hinter dem chinesischen, multimodalen Videogenerator Vidu wurde weiterentwickelt - die neue Version 1.5 bringt laut Shengshu Technology eine "Multi-Entitäten-Konsistenz". Dies will heißen, dass das Modell in der Lage ist, Abbildungen von verschiedensten Objekten, Figuren oder Umgebungen sinnvoll miteinander zu einem Video zu verweben. Was wiederum bedeutet, dass man bei der Generierung von KI-Clips mehr Kontrolle über die erstellten Bilder gewinnt, indem man inhaltliche Komponenten genauer vorgeben kann.

Vidu 1.5 generiert Videoclips aus bis zu 3 vorgegebenen Bildinhalten

Multimodal AI With New Emergence!

We&re thrilled to launch Vidu-1.5 next week, the world’s first multimodal model to support Multi-Entity Consistency! Vidu-1.5 can seamlessly integrate people, objects, and environments to generate stunning videos, overturning traditional… pic.twitter.com/41GyqezNcd
— Vidu AI (@Viduforhuman) November 9, 2024

Werden etwa Abbildungen einer Person, eines bestimmten Kleidungsstücks sowie eines Mofas hochgeladen als Referenz, errechnet Vidu 1.5 ein Video, in welchem diese Person wie gewünscht gekleidet ist und Mofa fährt - diese Funktionalität findet sich laut der Entwickler momentan in keinem anderen KI-Videomodell. Darüberhinaus sollen die Referenzobjekte (beziehungsweise -figuren und -umgebungen) im generierten Video in sich konsistent dargestellt werden und nicht, wie so häufig in KI-Videos, nach und nach ineinander morphen oder sich auflösen.

VIDU Multi-Entity Consistency

Give Vidu 2/3 images and it’ll turn them into a video—it’s pure magic!

Your own characters interacting with objects and in the exact environment you want!

Ads, movies… endless possibilities, and this is just the beginning!

Thanks… pic.twitter.com/xq7gmlStxt
— Hungry Donk-E (@hungrydonke) November 13, 2024

// Top-News auf einen Blick:

Ebenfalls neu ist die Fähigkeit, eine konsistente Figurendarstellung aus verschiedenen Blickwinkeln zu gewährleisten - werden drei Fotos einer Person vorgegeben, soll Vidu 1.5 eine nahtlose 360°-Ansicht errechnen und dabei auch verschiedene Gesichtsausdrücke natürlich wiedergeben können.

Erweiterte Kontrolle soll sich auch über die gewünschte (virtuelle) Kamerabewegung ausüben lassen, sodass sich horizontale und vertikale Schwenks sowie Zoomfahrten, auch in Kombination miteinander, für anspruchsvolle Einstellungen generieren lassen. Für Zeichentrick-Fans sind neue Animations-Styles sind hinzugekommen wie japanischer Fantasy oder Hyperrealismus.

Bilddetails sollen in den von Vidu 1.5 erstellten Clips nun genauer generiert werden, die maximale Auflösung beträgt wie bisher 1080p. Gleichzeitig soll es auch schneller gehen - um 4 Sekunden Bewegtbild zu generieren, sollen 25 Sekunden Rechenzeit ausreichend sein. Dank Fortschritten beim semantischen Verständnis soll das neue KI-Modell Textprompts präziser als zuvor interpretieren, sodass sich auch komplexe Szenen umsetzen lassen sollen.

Trend: Mehr Kontrollmöglichkeiten für Video-KIs

Mehr Kontrollmöglichkeiten über das Bild und eine bessere visuelle Konsistenz werden aktuell auch bei konkurrierenden Video-KIs angestrebt. So soll ein großes neues Feature im kommenden Kling 1.5 die Möglichkeit sein, eigene Charaktere trainieren zu können, um sie dann quasi als virtuelle Schauspieler zu nutzen. Runway wiederum erlaubt es mit dem neuen Gen-3 Alpha Turbo-Modell, über eine neue Kamerasteuerung ins Bild rein- oder rauszuzoomen, nach links oder rechts, nach oben oder unten zu schwenken oder das Bild zu rotieren.

mehr Infos bei
www.vidu.studio

Auf Socials teilen:

Leserkommentare // Neueste

Kommentieren >>

Ähnliche News //

News

KI Video Generator Vidu - die chinesische Antwort auf OpenAI Sora?

Das chinesische Technologieunternehmen ShengShu-AI und die Tsinghua-Universität haben am Wochenende ein KI-Video-Modell vorgestellt, welches nach nach eigenen Angaben mit Open AIs ...

// 12:56 Do, 2. Mai 2024von Rudi Schmidts

News

Editing per Prompt Google Veo am Start - neue Video-KI macht über 60 Sekunden lange Clips

Während das einstige Spitzenmodell OpenAIs Sora noch immer nicht öffentlich ist, geht der Kampf um die beste Video-KI unvermindert geht weiter - jetzt hat Google sein erstmals Mai ...

// 11:52 Fr, 6. Dez 2024von Thomas Richter

News

Generative Video-KI Pika 2.0 unterstützt "Scene Ingredients": Mehr Kontrolle, höhere Kosten

Seit kurzem läßt sich auch der KI-Videogenerator Pika mit einem aktualisierten Modell 2.0 nutzen - ganz neu hinzugekommen ist darin die Unterstützung von sogenannten "Scene ...

// 11:24 Do, 19. Dez 2024von blip

News

CM3leon - neue generative Bild-KI verspricht präzisere Gestaltungsmöglichkeiten

Meta hatte im April bereits ein ziemlich mächtiges KI-Modell zur Erstellung von Objektmasken vorgestellt,

// 10:18 Fr, 28. Jul 2023von blip

News

Video-to-Audio KI für Veo Google DeepMind wird Videos mit automatisch erzeugter Tonspur unterlegen

Die wenigsten KI-Videogeneratoren erstellen Clips inklusive Ton - unseres Wissens bildet Pika mit sowohl Dialogen als auch Sound Effects hier die einzige Ausnahme, während OpenAI ....

// 20:01 Mi, 19. Jun 2024von blip

zur Newsübersicht >

Top Deals für Filmemacher Erste Black Friday Angebote von Atomos, Nanlite, DZOFILM und mehr

Die vielen Rabattaktionen rund um den Black Friday (der dieses Jahr auf den 28. November fällt) sind immer wieder eine gute Gelegenheit für ein Schnäppchen - gerade wenn man ...

// 12:24 Di, 18. Nov 2025von Thomas Richter

Meinung

Hollywood as a Service? ARRIs Color KnowHow könnte Millionen Wert sein - als Workflow Lizenz für Dritte

Kamera-Hardware und die Color-Science in der Firmware waren bei ARRI bislang untrennbar verbunden. Doch muss das auch weiterhin so sein?

// 15:44 Mo, 17. Nov 2025von Rudi Schmidts

Test

Entry-Level Cinema Kamera Canon EOS C50 im Praxistest: Kompaktes Arbeitstier mit 7K 50p Raw - die neue FX3 Konkurrenz

Mit der EOS C50 rundet Canon sein Cinema EOS Portfolio nach unten hin ab und bringt gleichzeitig einen direkten Konkurrenten zur erfolgreichen Sony FX3 auf den Weg. Wir haben uns ...

// 15:55 Do, 13. Nov 2025von Rob

Test

Alive and Kicking Blackmagic Pocket Cinema Camera 4K Sensor-Test - Wiedersehen mit ProRes RAW

Nachdem Blackmagic seinem Pocket Kamera-Klassiker ein unerwartetes ProRes RAW Update beschert hat, fragen wir uns, für wen sich das neue RAW Format eigentlich lohnt...

// 13:49 Fr, 31. Okt 2025von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Praxis

Effektives Prompting für KI-Videos mit Adobe Firefly

Die neue Cine-Macht Blackmagic Ursa Cine 12K in der Praxis: High-End Cine Kamera mit herausragenden Fähigkeiten

Wir hatten Gelegenheit, mit der neuen Blackmagic Ursa Cine 12K neben unserem traditionellem Outdoor-Praxistest auch ein paar Indoor-Aufnahmen für ein weiteres slashCam-Projekt zu ...

// 10:37 Di, 7. Jan 2025von Rob

zur Artikelübersicht >

Aktuelle News //

News

Kostenlose 3D-Suite Blender 5.0 ist da: Meilenstein mit vielen Neuerungen für 3D, Animation und Postpro

Pünktlich zum Jahresende legt die Blender Foundation einen kleinen Knaller auf den digitalen Content-Creation-Tisch: Die Version 5.0 der freien 3D-Suite ist ab sofort verfügbar. .....

// 11:06 Mi, 19. Nov 2025von Rudi Schmidts

News

Mobile Video-Beleuchtung Nanlite Cookie und Cookie-S - Kompakte USB-C-Leuchten mit doppelseitigem Licht

Mit den neuen LED-Leuchten cookie und cookie-s erweitert Nanlite sein Portfolio um zwei besonders kompakte Lichtquellen, die speziell für mobile und improvisierte ...

// 09:41 Mi, 19. Nov 2025von Thomas Richter

zur Newsübersicht >

Bessere Objektkonsistenz Vidu 1.5 generiert Videoclips aus bis zu 3 vorgegebenen Bildinhalten

// Top-News auf einen Blick:

Trend: Mehr Kontrollmöglichkeiten für Video-KIs

KI Video Generator Vidu - die chinesische Antwort auf OpenAI Sora?

Editing per Prompt Google Veo am Start - neue Video-KI macht über 60 Sekunden lange Clips

Generative Video-KI Pika 2.0 unterstützt "Scene Ingredients": Mehr Kontrolle, höhere Kosten

CM3leon - neue generative Bild-KI verspricht präzisere Gestaltungsmöglichkeiten

Video-to-Audio KI für Veo Google DeepMind wird Videos mit automatisch erzeugter Tonspur unterlegen

Top Deals für Filmemacher Erste Black Friday Angebote von Atomos, Nanlite, DZOFILM und mehr

Hollywood as a Service? ARRIs Color KnowHow könnte Millionen Wert sein - als Workflow Lizenz für Dritte

Entry-Level Cinema Kamera Canon EOS C50 im Praxistest: Kompaktes Arbeitstier mit 7K 50p Raw - die neue FX3 Konkurrenz

Alive and Kicking Blackmagic Pocket Cinema Camera 4K Sensor-Test - Wiedersehen mit ProRes RAW

Sponsored Workshop Effektives Prompting für KI-Videos mit Adobe Firefly

Die neue Cine-Macht Blackmagic Ursa Cine 12K in der Praxis: High-End Cine Kamera mit herausragenden Fähigkeiten

Kostenlose 3D-Suite Blender 5.0 ist da: Meilenstein mit vielen Neuerungen für 3D, Animation und Postpro

Mobile Video-Beleuchtung Nanlite Cookie und Cookie-S - Kompakte USB-C-Leuchten mit doppelseitigem Licht

ARTIKEL

THEMEN