KI-Video Revolution reloaded Google Veo 3 vorgestellt - Die erste Video-KI mit voll integriertem Sound

Veo 3 generiert als erste Video-KI natives Audio - sowohl Sprache und Gesang, als auch Musik und Soundeffekte wie Geräusche und auch Tierlaute - alles passend zum entsprechenden Video. Dabei wird zum per Prompt vorgegebenen Text nicht nur der Dialog erzeugt, er wird von den Charakteren mit passender Stimme samt Mundbewegungen und der entsprechenden Mimik auch gesprochen.


 Google Veo 3
Google Veo 3


Mussten bisher für solche Szenen - relativ umständlich - mehrere KI-Tools eingesetzt werden, passiert das jetzt per Veo 3 mit nur einem Prompt. Bereits im letzten Sommer hatte Google Deepmind einen Preview auf die kommenden Audiofähigkeiten gegeben. Seitdem hat sich einiges getan - hier einige Beispiele:
















Veo 3 ist momentan noch ein Preview, wird also laufend weiterentwickelt - die Fähigkeiten und Qualität sind jedoch schon jetzt beeindruckend. Das Modell erzeugt als erste Video-KI Clips in 4K mit einer Länge von maximal 8 Sekunden. Generiert werden allerdings nur erwachsene Menschen - Kinder benötigen eine besondere Erlaubnis.



Hier einige der beeindruckenden Beispiele von Veo 3s Fähigkeiten bezüglich Gesang und Musik:






sowie Stimmen:








Und auch Sitcoms sind kein Problem für Veo 3:





Auch menschliche Bewegungen wie gehen oder tanzen sehen sehr gut aus. Bei Dialogen scheinen sogar sonst oft kritische Dinge wie Blickrichtung, Augenkontakt und die zeitlich und emotional passende Reaktion im Dialog sehr realistisch zu gelingen.












Abgesehen von der neuen Integration von Sound ist auch die Qualität von Veo 3 gegenüber dem Vorgängermodell (das ohnehin schon besser als die Konkurrenz wie OpenAIs Sora, Hailuo oder Kling war) optimiert. Veo 3 zeigt ein nochmals deutlich verbessertes Verständnis von Physik, Beleuchtung, Schatten und Objektinteraktionen, was die Videos noch realistischer aussehen läßt. Auch das Promptverständnis wurde optimiert, sodass sich Veo 3 genauer an die Anweisungen des Users halten kann. Allerdings ist auch Veo 3 nicht perfekt - es gibt immer noch gelegentlich Artefakte oder (Audio-)Fehler.






Veo 3 kann über Googles neues KI-Video-Tool Flow, das Kreativen zahlreiche Kontrollmöglichkeiten gewährt, oder über die Google Gemini App genutzt werden. Für jedes Prompt werden 1-4 verschiedene Versionen erstellt, unter denen der User auswählen kann.



Jedoch scheinen die besonderes auf Filmemacher zugeschnittenen Features von Flow wie die Steuerung der Kamerabewegungen, Stilanpassung mithilfe von Referenzbildern, Vorgabe des ersten und/oder letzten Frames einer Szene, Verlängerung des Videos momentan nur für Veo 2 verfügbar zu sein.







Veo 3 vorerst nur in den USA - zum Preis von 250 Dollar

Veo 3 wird vorerst nur im Rahmen von Googles AI Ultra-Abo zugänglich, das rund stolze 250 Dollar pro Monat kostet. Das Abo (und somit Veo 3) ist momentan auch nur innerhalb der USA zugänglich - mehr Länder sollen bald dazukommen. Aktuell gibt es für Neuabonnenten 50% Rabatt auf die ersten 3 Monate.



Neben der Nutzung von Flow und Veo 3 enthält das Abo auch eine Reihe weiterer Funktionen bzw. hohe Nutzunggrenzen von Gemini, NotebookLM, der Image-to-Video KI Whisk (allerdings nur mit Veo 2), YouTube Premium sowie - für Filmemacher sicherlich interessant - satte 30 TB Speicherkapazität für Google Drive, Photos und Gmail.






Das Google AI Pro Abo für rund 20 Dollar (erster Monat kostenlos für neue User) enthält ebenfalls die Nutzung von Flow, aber nur mit dem Veo 2 Modell.



Einem Userbericht nach soll Veo 3 auch schon innerhalb von Adobes Video-KI Firefly verfügbar sein, welche schon Veo 2 per API unterstützt.






Einfacher denn je: realistische Kurzfilme per Video-KI

Mit Hilfe von Veo 3 kann man jetzt also sehr einfach ziemlich echt aussehende Clips von redenden Menschen per KI generieren. Und aus den einzelnen, bis zu 8-sekündigen Clips, dank Charakter-und Stimmkonsistenz und Dialogfähigkeit, auch gleich ganz Kurzfilme. Hier einige User-generierte Beispielclips:







Die Beispiele demonstrieren schön, welche Revolution Google mit Veo 3 auslöst: echtes KI-Filmmaking nur per Prompt, ohne die Kenntnis mehrerer Tools rückt in erreichbare Nähe - das nötige Kapital vorausgesetzt.


Ähnliche News //
Umfrage
    Generative Video-KI: Hast du ein Abo?







    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash