Multimodale KI-Modelle ByteDance Vidi2 produziert selbstständig fertige Videos aus Rohmaterial

// 15:54 Mo, 1. Dez 2025von

Chinas ByteDance eröffnet den Dezember KI-Präsentationsreigen und demonstriert mit Paper und Demo ihr neuestes multimodales KI-Modell Vidi 2. Multimodale Modelle akzeptieren diverse Eingabetypen (z.B. Text, Audio, Bild oder Video) und können im Anschluss hieraus unterschiedlichen Output generieren.


Vidi2 ist darauf spezialisiert, viele Stunden Rohmaterial zu analysieren und zugehörige Prompts zu interpretieren. Als Output ist es unter anderem möglich, mit einem kompletten Skript ein poliertes TikTok-Video oder auch einen kompletten Film zu generieren. Vidi2 "lernt" dabei das Rohmaterial sehr detailliert kennen. So kann es beispielsweise die In- und Out-Points einzelner Szenen oder auch Personen oder Objekte im Rohmaterial finden.



Durch diese raumzeitliche Verknüpfung soll Vidi2 potenzielle Anwendungen in komplexen Bearbeitungsszenarien ermöglichen, wie beispielsweise das Verständnis von Handlung oder Charakteren, das automatische Umschalten zwischen verschiedenen Ansichten sowie intelligentes, kompositionsbewusstes Reframing und das Zuschneiden einzelner Szenen.



ByteDance setzt das Modell übrigens bereits bei TikTok in zwei Applikationen ein. "Smart Split" ist weltweit über TikTok Studio Web verfügbar und schneidet, rahmt, untertitelt und transkribiert längere Inhalte automatisch in mehrere kurze Videos, die direkt auf TikTok geteilt werden können. So können Creator beispielsweise ihren Alltags-Vlog oder eine Podcast-Folge in mehrere Clips aufteilen.


Smart Split schneidet, rahmt, untertitelt und transkribiert längere Inhalte automatisch
Smart Split schneidet, rahmt, untertitelt und transkribiert längere Inhalte automatisch


Zum Einstieg können Creator Inhalte hochladen, die länger als eine Minute sind, und die Abschnitte auswählen, die sie in kürzere Clips umwandeln möchten. Basierend auf dem ausgewählten Videoabschnitt kann Smart Split automatisch eine Videolänge festlegen oder Creator können eine bestimmte Länge angeben. Zusätzlich stehen verschiedene Optionen zur Bildunterschriftenformatierung zur Verfügung, und der Inhalt kann in vertikale Clips umgewandelt werden. Sobald Smart Split die Clips erstellt hat, können Creator jedes Video auswählen und direkt auf ihren TikTok-Account hochladen.



"AI Outline" soll dagegen Kreativen helfen, ihre Inhalte zu strukturieren, indem es Videotitel, Hashtags, Aufhänger und Gliederungen generiert. Dazu gibt man entweder eine Vorgabe ein oder man wählt ein häufig gesuchtes Thema in den Creator Search Insights aus. AI Outline soll so einen besseren Überblick darüber bieten, wie man Inhalte strukturieren kann. Also wohl, falls man selber nicht mehr weiß, was man eigentlich mit seinem Video aussagen wollte ;)


Mit einem Einkauf bei unseren Partnern unterstützt Du slashCam // Affiliate
Ähnliche News //
Umfrage
    Generative Video-KI: Hast du ein Abo?







    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash