Bald filmreif? Neue NVIDIA-KI erzeugt hochauflösende Videos per Texteingabe

// 10:28 Do, 20. Apr 2023von Thomas Richter

Schneller als noch vor kurzem gedacht verbessert sich die Qualität von Text-zu-Video-KIs. Waren vor kurzer Zeit vorgestellte Video-KIs wie Metas Make-a-Video, Googles Imagen und Phenaki oder das quelloffene VideoFusion noch beschränkt auf die Erzeugung kleiner Videos (256 x 256 bzw. 128 x 128 Pixel, nur Imagen erreichte 1.280 x 768) erzielt die neue Video-KI von Nvidia jetzt Auflösungen von bis zu 1.280 x 2.048 Pixeln bei 24 fps und zeigt deutlich weniger temporale Artefakte bzw. eine bessere Kohärenz zwischen den einzelnen Frames.

Bald filmreif? Neue NVIDIA-KI erzeugt hochauflösende Videos per Texteingabe

Mitgearbeitet im Forscherteam von NVIDIA haben mit Andreas Blattman und Robin Rombach zwei Experten der LMU München, die auch schon die Bild-KI Stable Diffusion mitentwickelten. Wie diese nutzt auch die neue Video-KI ein latentes Diffusionsmodell (LDM) für Standbilder. Aus dem Standbildgernerator wird ein Videogenerator, indem eine zeitliche Dimensionsvariable in das Diffusionsmodell mit eintrainiert wird. Da das genutzte Modell von Stable-Diffusion-Gewichten abgeleitet wurde, liegt die primäre Output-Auflösung noch deutlich unter HD.

Deswegen bekommt auch der darauffolgende Diffusion Upsampler ebenfalls eine zeitliche Komponente spendiert, was dann zu einer zeitlich konsistenten Video-Superresolution führt. Mit dieser Verkettung sind dann mehrere Sekunden lange Videos mit einer Auflösung von bis zu 1.280 x 2.048 Pixel bei "vertretbarem" Rechenaufwand möglich. Die Framerate wird zweimal mit der Hilfe eines speziellen Latent Diffusion Modells hochgesamplet, um relativ flüssige Bilder mit 24 fps zu ermöglichen.

Eine ganze Reihe von 4.7 Sekunden langen Beispielvideos kann man auf der Demoseite in voller Auflösung betrachten, wenn man sie jeweils in einem extra Fenster öffnet.

Interessant ist auch die Möglichkeit, per DreamBooth eigene Objekte in die synthetisierten Videos einzubinden, also die Text-to-Video KI zu personalisieren:

Es gibt auch einen ganz besonderen Anwendungsfall, in welchem die neue Methode sogar mehrere Minuten lange kohärente Videos - allerdings nur mit einer Auflösung von 512 x 1.024 Pixeln - erzeugen kann, nämlich Videos von Fahrszenen in freier Wildbahn. Im folgenden ein 9-sekündiger Clip - das ganze 5-minütige Video findet sich hier.

Bei der aktuellen Entwicklungsgeschwindigkeit dürfte es nicht mehr lange dauern, bis auch noch längere, wirklich fotorealistische Videos per Texteingabe frei erzeugt werden können.

mehr Infos bei
research.nvidia.com

Auf Socials teilen:

Leserkommentare // Neueste

Alex // 09:44 am 29.4.2023

Stand jetzt gebe ich dir in weiten Teilen recht. Aber ich bin da eher bei Frank. "Noch". Ich habe zwar keine Glaskugel, aber ich bin mir zu 100 % sicher, dass das genau die...weiterlesen

iasi // 23:54 am 28.4.2023

Selbst für ungefähre Themen eines Hintergrundes tippe ich ewig, bis ich mal einen Glückstreffer lande, der einigermaßen als unscharfer Hintergrund durchgehen kann...weiterlesen

Frank Glencairn // 21:42 am 28.4.2023

Das hab ich ja gemeint. Je "beliebiger" die Bilder sein können - ich brauch z.B. nur ein paar Illustrationen für den Hintergrund, die halt so ungefähr ein gewisses Thema haben...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Forscher von Google haben eine neue KI vorgestellt, die nach einem ähnlichen Muster wie die gerade sehr populären Text-2-Image KIs wie DALL-E 2, Midjourney oder Stable Diffusion .....

// 10:57 Mo, 30. Jan 2023von Thomas Richter

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

News

Kampf gegen KI-Fakes Neuer Algorithmus erkennt KI-Videos mit 98% Genauigkeit

Als die ersten Videos von OpenAIs Video-KI Sora erschienen, war klar, dass demnächst - früher als erwartet - massenhaft täuschend echt aussehende Filme von KIs generiert werden ...

// 14:14 Fr, 28. Jun 2024von Thomas Richter

News

Text-zu-Video KI jetzt auch von Google: Imagen Video

Nachdem Meta gerade seine Make-a-Video KI zur Generierung von Videos nach Textbeschreibung vorgestellt hatte, hat Google jetzt nachgezogen und mit Imagen Video auch eine solche KI ...

// 16:48 Do, 6. Okt 2022von Thomas Richter

News

Nach der Bild- die Videorevolution: Neue KI "Make-a-Video" generiert Videos nach Text

KIs generieren immer bessere Bilder nach Textbeschreibungen und es war klar, was der nächste Schritt sein würde: das Erstellen von Videos. Jetzt hat Meta AI, die KI ...

// 14:11 Fr, 30. Sep 2022von Thomas Richter

zur Newsübersicht >

Unterstützung für mehr Handys Kostenlose Blackmagic Camera App 1.1 für Android bringt viele neue Funktionen

Vor rund einem Monat hatte Blackmagic seine kostenlose Camera App auch für Android veröffentlicht, jetzt ist bereits das erste Update erschienen, das zahlreiche neue Funktionen ...

// 14:17 Mo, 22. Jul 2024von Thomas Richter

News

Nicht nur 3D Animation Blender 4.2 LTS - kostenloses 3D-Softwarepaket jetzt mit GPU-Compositor

Das quelloffene 3D-Modelling- und Animations-Paket Blender wächst weiter. In der neuen Version 4.2 LTS sind sogar ziemlich relevante Verbesserungen für die Videobearbeitung ...

// 11:50 Sa, 20. Jul 2024von Rudi Schmidts

News

6K bzw. 8K 60p RAW Video Canon EOS R1 und R5 Mark II vorgestellt mit DIGIC Accelerator und mehr

Gleich zwei neue Spitzenmodelle für sein EOS R-System präsentiert Canon heute - die EOS R1 und EOS R5 Mark II bringen beide verbesserte Autofokus-Fähigkeiten sowie eine erweiterte ...

// 12:05 Mi, 17. Jul 2024von blip

News

APS-C Wechselobjektivkamera Kompakte Sony ZV-E10 II mit 10bit 4K 60p und Kinolook-Funktionen angekündigt

Sony verbessert seine kleine "Vlogging"-Kamera ZV-E10 - so verfügt die neue Generation II (wie im Vorfeld gemunkelt) über einen neuen Sensor, Dank welchem nun 4K-Videoaufnahmen ...

// 17:23 Mi, 10. Jul 2024von blip

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Aktuelles

Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?

Nach Bild- und Text-generierenden KIs gibt es noch weiteres Feld, in welchem gerade per künstlicher Intelligenz enorme Fortschritte gemacht werden und zwar bei der Synthese von ...

// 19:47 Mo, 6. Feb 2023von Thomas Richter

zur Artikelübersicht >

Aktuelle News //

News

Geleakte Liste Runway Gen-3 Video-KI wurde an tausenden, ausgesuchten YouTube-Videos trainiert

KI-Videomodelle werden zunehmend besser, die Qualität ihres Outputs hängt bekanntlich jedoch stark von dem Videomaterial ab, anhand dessen sie lernen, wie Videos auszusehen haben. ...

// 17:13 Fr, 26. Jul 2024von blip

News

Mit besseren Kameras? Neue Drohnen im Anflug: Erst DJI Air 3S, dann Mavic 4?

Schon seit Mai kursieren Gerüchte über ein neues Drohnenmodell von DJI: zunächst drehten sich die Leaks der bekannten Accounts @OsitaLV und @Quadro_News um vereinzelte Abbildungen ...

// 19:14 Do, 25. Jul 2024von Thomas Richter

zur Newsübersicht >