Logo Logo
/// News

Bald für jedermann: Kostenlose Bildgenerierung per KI auf dem Heim-PC

[10:41 Mo,15.August 2022 [e]  von ]    

Der KI-Algorithmus zum Austauschen von Videohintergründen, dem wir gerade eine eigene News gewidmet haben, nutzt als Grundlage zur Bilderstellung die offene bildgenerierende KI Stable Diffusion. Sie wurde von den KI Forschern Patrick Esser und Robin Rombach entwickelt und gerade als geschlossene Beta gestartet. Das Spannendste ist, daß Stable Diffusion schon bald als Software veröffentlicht werden wird, welche auf Consumer-PCs läuft. Es reicht schon eine Grafikkarte mit 5 GB VRAM (wie etwa eine Nvidia GeForce GTX 1660, RTX 2060 oder eine AMD Radeon RX 5600) aus, um 512x512 Pixel große Bilder in wenigen Sekunden zu erzeugen.


starry-diffusion
Mit Stable Diffusion generiertes Bild


So wird die Generierung von Bildern per Text, die bisher nur einem eher engen Kreis von Menschen zugänglich war (oder nur wenige kostenlose Generierungen zuließ), wie etwa per DALL-E 2 und Midjourney), bald für sehr viel mehr Menschen erfahrbar, die damit selbst ohne jede Beschränkung experimentieren können.

Stable-Diffusion-examples1


Interessant ist in diesem Zusammenhang auch die Aussage von David Holz, dem CEO der Bild-KI Midjourney in einem Interview über die Kosten. Ihm zufolge kostet ein Trainingslauf zum Einlesen eines Pools von Milliarden von Bildern rund 50.000 Dollar und muss meist 10-20 mal wiederholt werden, um zu einem befriedigenden Ergebnis zu kommen. Stable Diffusion trainiert sein Modell mittels 4.000 Nvidia A100 Tensor-Core-GPUs, die jeweils eine Speicherbandbreite von über 2 TB/s besitzen. Sind die Trainingsdaten und damit das Modell erst einmal erstellt, wird viel weniger Rechenleistung benötigt, um den eigentlichen Job auszuführen, also Bilder zu generieren.

i1xqxvjsq2h91
Obi-Wan Kenobi eating only one Cannoli


Diese Asymmetrie ist typische für neuronale Netzwerke, bei denen viel Rechenpower in das Training gesteckt werden muss, das daraus resultierende spezifische Modell, also das neuronale Netz mit all seinen Gewichtungen der einzelnen Knotenpunkte, dann aber viel weniger Leistung benötigt. Kein Wunder - besteht doch zum Beispiel das für Stable Diffusion verwendete, öffentliche Laion B5 Dataset aus einer 240 TB großen Sammlung von 5 Milliarden Bildern samt mehrsprachigen Bildbeschreibungen (das hier durchsucht werden kann), das für ein Trainingslauf eingelesen und gelernt werden muss. Wir sind jedenfalls gespannt auf die ersten selbst erzeugten Bilder und freuen uns auf die Experimente damit. Bis dahin hier ein schöner Vergleich einiger aktueller bildgeneriernder KIs und ihrer besonderen Stile und zwar DALL-E 2, Stable Duffusion, Crayon, Midjourney und DALL-E Flow.

Link mehr Informationen bei stability.ai

  
[6 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
-paleface-    00:27 am 16.8.2022
Man kann vermurlich irgendwann unreal engine material per ai zusammen basteln können. Und dann werden auch Filme daraus entstehen.
berlin123    15:28 am 15.8.2022
Schauen wir mal was da rauskommt. Als Oldschool Variante gibtd das ja für Groschenromanautoren als Morphologischer Kasten. Man würfelt sich da die Story einfach aus. Aber...weiterlesen
Abercrombie    14:46 am 15.8.2022
Wird für (Dreh-)Bücher schon dran gearbeitet: http://www.frogs42.com/
[ Alle Kommentare ganz lesen]

  Vorige News lesen Nächste News lesen 
bildSeagate kündigt 30 TB Festplatten für 2023 an, 50 TB und mehr sollen 2026 kommen bildGrafikkartenpreise fallen immer weiter - jetzt zuschlagen oder auf neue Nvidia RTX 4000 GPUs warten?


verwandte Newsmeldungen:
KI:

PIKA 1.0 angekündigt - Generative KI-Videos mit erstaunlicher Qualität 29.November 2023
Der nächste Schritt ist da: KI trainiert KI (und braucht den Menschen nicht mehr) 28.November 2023
Insta360 Ace Pro - Action Cam mit 8K-Sensor, Leica Optik und viel KI 24.November 2023
Stable Video Diffusion - Freies KI-Diffusionsmodell zur Videoerzeugung vorgestellt 23.November 2023
Boris FX: Continuum bekommt KI-Funktionen - Denoiser und Upscaler 21.November 2023
Meta Emu Video / Edit - verbessert Konsistenz in generativen KI Videos 20.November 2023
Adobe-KI zerlegt Audioclip in verschiedene Spuren - Project Sound Lift 17.November 2023
alle Newsmeldungen zum Thema KI


[nach oben]

















passende Forenbeiträge zur News:

Archive

2023

Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2022
Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

2005

2004

2003

2002

2001

2000






































update am 2.Dezember 2023 - 23:03
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*