Logo Logo
/// News

Neue Nvidia-KI generiert Bilder 30x schneller als Stable Diffusion

[16:10 Mi,8.März 2023 [e]  von ]    

Ein Forscherteam von Nvidia und der Universität Tübingen hat eine neue (alte) Methode zur Bildgenerierung per KI vorgestellt, welche gleich zwei große Vorteile gegenüber der bisher verwendeten aufweist. Das neue, StyleGAN-T getaufte Verfahren basiert ganz klassisch auf GANs (Generative Adverserial Network), welches von Nvidia schon lange in Form von StyleGAN für mehrere interessante Anwendungen eingesetzt wurde, wie zum Beispiel schon 2018 für die Generierung beliebiger menschlicher Gesichter oder das künstliche Altern von Gesichtern.


StyleGAN-T-Morph


Dieses Verfahren kann dank der neuen Forschungen jetzt auch Bilder per Prompt generieren, ganz so wie die aktuellen Bild-KIs, wie etwa DALL-E2, Midjourney oder das quelloffene und deswegen am weitesten verbreitete Stable Diffusion. Diese setzen alle auf das latent Diffusion Model, um Bilder aus Text zu erzeugen. Demgegenüber zeichnet sich das neue StyleGAN-T Verfahren durch zwei besondere Eigenschaften aus: es ist deutlich schneller und kann besser zwischen den Ergebnissen unterschiedlicher Prompts morphen.

StyleGAN-T-Architektur
Architektur von StyleGAN-T


Wie schnell StyleGAN-T ist (und wie gut es nahezu stufenlos von einem zu einem anderen Bild wechseln kann), demonstriert das folgende Video sehr gut, in welchem jeder 512 x 512 Pixelausschnitt in 0.1 Sekunden - d.h. nahezu in Echtzeit - auf einer Nvidia A100 Tensor Core GPU generiert wurde:



Deutlich wird der Unterschied in der Geschwindigkeit der Bildgenerierung auch in der folgenden Übersicht, einem Vergleich mit anderen Bild-KIs wie Stable Diffusion und Googles Imagen. Hier ist das neue Verfahren 37x schneller als Stable Diffusion und über 90x schneller als Imagen.

NVIDIA-KI-Benchmarks


Auf schwächeren GPUs als der hochspezialisierten Nvidia A100 läuft die Bildgenerierung natürlich langsamer als 0.1 Sekunden pro Bild, aber die relative Geschwindigkeit gegenüber den per Diffusion erzeugten Bildern sollte in etwa bestehen bleiben. Zum Vergleich: auf einer Nvidia RTX 3090 dauert die Generierung von 56 Bildern mit 512 × 512 Auflösung rund 6 Sekunden. Trainiert wurde StyleGAN-T 4 Wochen lang auf 64 Nvidia A100 GPUs, d.h. mit recht begrenzter Leistung - würde mehr Ressourcen ins Training investiert, könnte die Bildqualität vermutlich noch weiter gesteigert werden.

Der zweite Vorteil der Erzeugung von Bildern per GANs ist die für die Möglichkeit, den Latent Space zu erkunden, d.h. zwischen verschiedenen Ergebnisse zu interpolieren und so visuell zwischen unterschiedlichen Ergebnissen bei gleichen oder auch anderen Textprompts zu morphen, um sie nahtlos ineinander übergehen zu lassen.

Diese allgemeine Fähigkeit von (Bild-)GANs wird recht verständlich im folgenden Clip von 2 Minute Paper demonstriert:



Link mehr Informationen bei sites.google.com

  
[2 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
Frank Glencairn    09:04 am 9.3.2023
In a nut shell: beim aktuellen Stand der Dinge - vergiss es.
Jalue    08:36 am 9.3.2023
Liebe Redaktion, das ist ja alles sehr interessant, wobei ich als Mensch mit bestenfalls durchschnittlichem IT-Wissen (womit ich für die Mehrheit der User hier stehen dürfte)...weiterlesen
[Kommentare ganz lesen]

  Vorige News lesen Nächste News lesen 
bildGünstiger: S35-Versionen der RED V-RAPTOR (XL) 8K Kameras offiziell vorgestellt bildKIs imitieren Stimmen perfekt - Vorsicht vor anrollenden Betrugswellen


verwandte Newsmeldungen:
Machine Learning:

Microsoft mit generativen KI-Modellen für jedermann im Browser - Bing Image Creator 23.März 2023
Adobe kündigt Firefly an: Generative KI-Modelle nun direkt von Adobe 21.März 2023
Runway Gen2: Stable Diffusion Schöpfer stellen neue Text-to-Video-KI vor 20.März 2023
VideoFusion: Erste Open Source Video-KI ist da - und läuft auch auf dem Heim-PC 20.März 2023
Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände 19.März 2023
KI verwandelt WLAN Router in Raum-Radar 18.März 2023
Gilt das Urheberrecht auch für per KI erzeugte Inhalte? Eher nicht 17.März 2023
alle Newsmeldungen zum Thema Machine Learning

Computer:

VideoFusion: Erste Open Source Video-KI ist da - und läuft auch auf dem Heim-PC 20.März 2023
Apple: Neue Macs vor dem Start - kommt endlich der neue Mac Pro mit M2 Ultra? 10.März 2023
Chrome, Firefox und VLC profitieren: FFmpeg 6.0 bringt u.a. AV1-Decoding per GPU 1.März 2023
Kostenloses KI-Tool NVIDIA Canvas: Fotorealistische Traumlandschaften selbst gestalten 15.Februar 2023
Schönere Zeitrafferaufnahmen durch neue NVIDIA-KI 11.Februar 2023
Neuer KI-Effekt NVIDIA Eye Contact: Bye bye Teleprompter? 25.Januar 2023
2023: Das Jahr der innovativen Notebook-Displays 22.Januar 2023
alle Newsmeldungen zum Thema Computer


[nach oben]

















passende Forenbeiträge zur News:

Archive

2023

März - Februar - Januar

2022
Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

2005

2004

2003

2002

2001

2000






































update am 23.März 2023 - 19:20
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*