Logo Logo
/// News

Bald filmreif? Neue NVIDIA-KI erzeugt hochauflösende Videos per Texteingabe

[10:28 Do,20.April 2023 [e]  von ]    

Schneller als noch vor kurzem gedacht verbessert sich die Qualität von Text-zu-Video-KIs. Waren vor kurzer Zeit vorgestellte Video-KIs wie Metas Make-a-Video, Googles Imagen und Phenaki oder das quelloffene VideoFusion noch beschränkt auf die Erzeugung kleiner Videos (256 x 256 bzw. 128 x 128 Pixel, nur Imagen erreichte 1.280 x 768) erzielt die neue Video-KI von Nvidia jetzt Auflösungen von bis zu 1.280 x 2.048 Pixeln bei 24 fps und zeigt deutlich weniger temporale Artefakte bzw. eine bessere Kohärenz zwischen den einzelnen Frames.


NVIDIA-KI-grid


Mitgearbeitet im Forscherteam von NVIDIA haben mit Andreas Blattman und Robin Rombach zwei Experten der LMU München, die auch schon die Bild-KI Stable Diffusion mitentwickelten. Wie diese nutzt auch die neue Video-KI ein latentes Diffusionsmodell (LDM) für Standbilder. Aus dem Standbildgernerator wird ein Videogenerator, indem eine zeitliche Dimensionsvariable in das Diffusionsmodell mit eintrainiert wird. Da das genutzte Modell von Stable-Diffusion-Gewichten abgeleitet wurde, liegt die primäre Output-Auflösung noch deutlich unter HD.



Deswegen bekommt auch der darauffolgende Diffusion Upsampler ebenfalls eine zeitliche Komponente spendiert, was dann zu einer zeitlich konsistenten Video-Superresolution führt. Mit dieser Verkettung sind dann mehrere Sekunden lange Videos mit einer Auflösung von bis zu 1.280 x 2.048 Pixel bei "vertretbarem" Rechenaufwand möglich. Die Framerate wird zweimal mit der Hilfe eines speziellen Latent Diffusion Modells hochgesamplet, um relativ flüssige Bilder mit 24 fps zu ermöglichen.

NVIDIA-KI-model


Eine ganze Reihe von 4.7 Sekunden langen Beispielvideos kann man auf der Demoseite in voller Auflösung betrachten, wenn man sie jeweils in einem extra Fenster öffnet.

Interessant ist auch die Möglichkeit, per DreamBooth eigene Objekte in die synthetisierten Videos einzubinden, also die Text-to-Video KI zu personalisieren:

NVIDIA-KI-Dreamboothed


Es gibt auch einen ganz besonderen Anwendungsfall, in welchem die neue Methode sogar mehrere Minuten lange kohärente Videos - allerdings nur mit einer Auflösung von 512 x 1.024 Pixeln - erzeugen kann, nämlich Videos von Fahrszenen in freier Wildbahn. Im folgenden ein 9-sekündiger Clip - das ganze 5-minütige Video findet sich hier.



Bei der aktuellen Entwicklungsgeschwindigkeit dürfte es nicht mehr lange dauern, bis auch noch längere, wirklich fotorealistische Videos per Texteingabe frei erzeugt werden können.

Link mehr Informationen bei research.nvidia.com

  
[23 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
Alex    09:44 am 29.4.2023
Stand jetzt gebe ich dir in weiten Teilen recht. Aber ich bin da eher bei Frank. "Noch". Ich habe zwar keine Glaskugel, aber ich bin mir zu 100 % sicher, dass das genau die...weiterlesen
iasi    23:54 am 28.4.2023
Selbst für ungefähre Themen eines Hintergrundes tippe ich ewig, bis ich mal einen Glückstreffer lande, der einigermaßen als unscharfer Hintergrund durchgehen kann...weiterlesen
Frank Glencairn    21:42 am 28.4.2023
Das hab ich ja gemeint. Je "beliebiger" die Bilder sein können - ich brauch z.B. nur ein paar Illustrationen für den Hintergrund, die halt so ungefähr ein gewisses Thema haben...weiterlesen
[ Alle Kommentare ganz lesen]

  Vorige News lesen Nächste News lesen 
bildVon 12mm auf 28mm in 0,5s: Powerzoom NIKKOR Z DX 12-28 mm f/3,5-5,6 angekündigt bildDeity Theos Funkstrecke mit 32Bit Float Backup-Recording vorgestellt


verwandte Newsmeldungen:
KI:

Making of - So entstehen die viralen Wes Anderson KI-Videos 29.Mai 2023
Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion 24.Mai 2023
Adobe Generative Fill - KI-Bildergänzung in Photoshop, einfach für jedermann! 23.Mai 2023
Diffusae - Stable Diffusion als KI-Plugin für Adobe After Effects 23.Mai 2023
Synthetische KI-Stimmen machen professionellen Sprechern Konkurrenz 21.Mai 2023
Drag your GAN - KI-Bilder einfach mit der Maus verändern 19.Mai 2023
Stable Diffusion verjüngt Harrison Ford 16.Mai 2023
alle Newsmeldungen zum Thema KI

Computer:

Spacetop: Notebook mit virtuellem 100" Riesendisplay - per Augmented Reality Brille 19.Mai 2023
Ab sofort Livestreaming mit 4K und 60 fps mit Nvidia RTX 40 Grafikkarten 8.Mai 2023
Neue NVIDIA-KI kann Tennisspiele simulieren - nur anhand von Fernsehbildern 7.Mai 2023
Radeon RX 7950 XTX und XT - AMD verrät versehentlich RTX 4090 Konkurrent 3.Mai 2023
NVIDIA RTX 5000 ADA - Grafikkarte mit 32 GB Ram in den Startlöchern 24.April 2023
Nvidia RTX 4070 wird ausgeliefert - Gute Leistung, aber höhere Preise für die Mittelklasse 14.April 2023
AMD Alveo MA35D: FPGA-Beschleuniger für AV1-, H.265- und H.264-Codecs 12.April 2023
alle Newsmeldungen zum Thema Computer


[nach oben]

















passende Forenbeiträge zur News:

Archive

2023

Mai - April - März - Februar - Januar

2022
Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

2005

2004

2003

2002

2001

2000






































update am 30.Mai 2023 - 15:02
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*