Logo Logo
/// News

Bald für jedermann: Kostenlose Bildgenerierung per KI auf dem Heim-PC

[10:41 Mo,15.August 2022 [e]  von ]    

Der KI-Algorithmus zum Austauschen von Videohintergründen, dem wir gerade eine eigene News gewidmet haben, nutzt als Grundlage zur Bilderstellung die offene bildgenerierende KI Stable Diffusion. Sie wurde von den KI Forschern Patrick Esser und Robin Rombach entwickelt und gerade als geschlossene Beta gestartet. Das Spannendste ist, daß Stable Diffusion schon bald als Software veröffentlicht werden wird, welche auf Consumer-PCs läuft. Es reicht schon eine Grafikkarte mit 5 GB VRAM (wie etwa eine Nvidia GeForce GTX 1660, RTX 2060 oder eine AMD Radeon RX 5600) aus, um 512x512 Pixel große Bilder in wenigen Sekunden zu erzeugen.


starry-diffusion
Mit Stable Diffusion generiertes Bild


So wird die Generierung von Bildern per Text, die bisher nur einem eher engen Kreis von Menschen zugänglich war (oder nur wenige kostenlose Generierungen zuließ), wie etwa per DALL-E 2 und Midjourney), bald für sehr viel mehr Menschen erfahrbar, die damit selbst ohne jede Beschränkung experimentieren können.

Stable-Diffusion-examples1


Interessant ist in diesem Zusammenhang auch die Aussage von David Holz, dem CEO der Bild-KI Midjourney in einem Interview über die Kosten. Ihm zufolge kostet ein Trainingslauf zum Einlesen eines Pools von Milliarden von Bildern rund 50.000 Dollar und muss meist 10-20 mal wiederholt werden, um zu einem befriedigenden Ergebnis zu kommen. Stable Diffusion trainiert sein Modell mittels 4.000 Nvidia A100 Tensor-Core-GPUs, die jeweils eine Speicherbandbreite von über 2 TB/s besitzen. Sind die Trainingsdaten und damit das Modell erst einmal erstellt, wird viel weniger Rechenleistung benötigt, um den eigentlichen Job auszuführen, also Bilder zu generieren.

i1xqxvjsq2h91
Obi-Wan Kenobi eating only one Cannoli


Diese Asymmetrie ist typische für neuronale Netzwerke, bei denen viel Rechenpower in das Training gesteckt werden muss, das daraus resultierende spezifische Modell, also das neuronale Netz mit all seinen Gewichtungen der einzelnen Knotenpunkte, dann aber viel weniger Leistung benötigt. Kein Wunder - besteht doch zum Beispiel das für Stable Diffusion verwendete, öffentliche Laion B5 Dataset aus einer 240 TB großen Sammlung von 5 Milliarden Bildern samt mehrsprachigen Bildbeschreibungen (das hier durchsucht werden kann), das für ein Trainingslauf eingelesen und gelernt werden muss. Wir sind jedenfalls gespannt auf die ersten selbst erzeugten Bilder und freuen uns auf die Experimente damit. Bis dahin hier ein schöner Vergleich einiger aktueller bildgeneriernder KIs und ihrer besonderen Stile und zwar DALL-E 2, Stable Duffusion, Crayon, Midjourney und DALL-E Flow.

Link mehr Informationen bei stability.ai

  
[6 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
-paleface-    00:27 am 16.8.2022
Man kann vermurlich irgendwann unreal engine material per ai zusammen basteln können. Und dann werden auch Filme daraus entstehen.
berlin123    15:28 am 15.8.2022
Schauen wir mal was da rauskommt. Als Oldschool Variante gibtd das ja für Groschenromanautoren als Morphologischer Kasten. Man würfelt sich da die Story einfach aus. Aber...weiterlesen
Abercrombie    14:46 am 15.8.2022
Wird für (Dreh-)Bücher schon dran gearbeitet: http://www.frogs42.com/
[ Alle Kommentare ganz lesen]

  Vorige News lesen Nächste News lesen 
bildSeagate kündigt 30 TB Festplatten für 2023 an, 50 TB und mehr sollen 2026 kommen bildGrafikkartenpreise fallen immer weiter - jetzt zuschlagen oder auf neue Nvidia RTX 4000 GPUs warten?


verwandte Newsmeldungen:
Computer:

Nvidia RTX 4080/90 Preissenkung, Konkurrent AMD RX 7900 XT(X) startet in Kürze 5.Dezember 2022
Nvidia RTX 6000 mit 48 GB Speicher und 8 Pin Stromanschluss kostet 7349 Dollar 1.Dezember 2022
Nvidia Magic3D - beliebige 3D-Objekte durch Textbeschreibung erzeugen 29.November 2022
RTX 4090 - Nvidia vermutet Anwendungsfehler als Grund für Kabelbrände 22.November 2022
Nvidia RTX 4070 Ti ab 5. Januar verfügbar - 40 TFlops, aber nur 500 GB/s 10.November 2022
Neue Grafikkarten Generation von AMD - RX 7900 XT(X) mit zwei Video Engines 4.November 2022
Neuer Apple Mac Pro mit M2 Extreme mit bis zu 48 CPU- und 152 GPU-Cores verspätet sich 1.November 2022
alle Newsmeldungen zum Thema Computer

Machine Learning:

Heavy Metal meets Midjourney: Musikvideo aus 10.000 KI-generierten Bildern 4.Dezember 2022
Meta Encodec komprimiert mit KI Audio-Dateien deutlich stärker als MP3 21.November 2022
KI kopiert Filmstil von "Into the Spider-Verse"in Rekordzeit 14.November 2022
MAXIM - KI-Tool vereint diverse Bildverbesserungen in einem Modell 13.November 2022
Blackmagic Resolve 18.1 Update u.a. mit KI-Sprach-Isolation und Vektor-Keyframes 11.November 2022
Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die Gretchenfrage 5.November 2022
AvatarCLIP: Neue KI generiert und animiert 3D-Avatare per Textbeschreibung 28.Oktober 2022
alle Newsmeldungen zum Thema Machine Learning


[nach oben]

















passende Forenbeiträge zur News:

Archive

2022

Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2021
Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

2005

2004

2003

2002

2001

2000






































update am 6.Dezember 2022 - 16:00
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*