Bald für jedermann: Kostenlose Bildgenerierung per KI auf dem Heim-PC

// 10:41 Mo, 15. Aug 2022von Thomas Richter

Der KI-Algorithmus zum Austauschen von Videohintergründen, dem wir gerade eine eigene News gewidmet haben, nutzt als Grundlage zur Bilderstellung die offene bildgenerierende KI Stable Diffusion. Sie wurde von den KI Forschern Patrick Esser und Robin Rombach entwickelt und gerade als geschlossene Beta gestartet. Das Spannendste ist, daß Stable Diffusion schon bald als Software veröffentlicht werden wird, welche auf Consumer-PCs läuft. Es reicht schon eine Grafikkarte mit 5 GB VRAM (wie etwa eine Nvidia GeForce GTX 1660, RTX 2060 oder eine AMD Radeon RX 5600) aus, um 512x512 Pixel große Bilder in wenigen Sekunden zu erzeugen.

Image generated with Stable Diffusion — Mit Stable Diffusion generiertes Bild

So wird die Generierung von Bildern per Text, die bisher nur einem eher engen Kreis von Menschen zugänglich war (oder nur wenige kostenlose Generierungen zuließ), wie etwa per DALL-E 2 und Midjourney), bald für sehr viel mehr Menschen erfahrbar, die damit selbst ohne jede Beschränkung experimentieren können.

// Top-News auf einen Blick:

Interessant ist in diesem Zusammenhang auch die Aussage von David Holz, dem CEO der Bild-KI Midjourney in einem Interview über die Kosten. Ihm zufolge kostet ein Trainingslauf zum Einlesen eines Pools von Milliarden von Bildern rund 50.000 Dollar und muss meist 10-20 mal wiederholt werden, um zu einem befriedigenden Ergebnis zu kommen. Stable Diffusion trainiert sein Modell mittels 4.000 Nvidia A100 Tensor-Core-GPUs, die jeweils eine Speicherbandbreite von über 2 TB/s besitzen. Sind die Trainingsdaten und damit das Modell erst einmal erstellt, wird viel weniger Rechenleistung benötigt, um den eigentlichen Job auszuführen, also Bilder zu generieren.

Obi-Wan Kenobi eating only one cannoli — Obi-Wan Kenobi eating only one Cannoli

Diese Asymmetrie ist typische für neuronale Netzwerke, bei denen viel Rechenpower in das Training gesteckt werden muss, das daraus resultierende spezifische Modell, also das neuronale Netz mit all seinen Gewichtungen der einzelnen Knotenpunkte, dann aber viel weniger Leistung benötigt. Kein Wunder - besteht doch zum Beispiel das für Stable Diffusion verwendete, öffentliche Laion B5 Dataset aus einer 240 TB großen Sammlung von 5 Milliarden Bildern samt mehrsprachigen Bildbeschreibungen (das hier durchsucht werden kann), das für ein Trainingslauf eingelesen und gelernt werden muss. Wir sind jedenfalls gespannt auf die ersten selbst erzeugten Bilder und freuen uns auf die Experimente damit. Bis dahin hier ein schöner Vergleich einiger aktueller bildgeneriernder KIs und ihrer besonderen Stile und zwar DALL-E 2, Stable Duffusion, Crayon, Midjourney und DALL-E Flow.

mehr Infos bei
stability.ai

Auf Socials teilen:

Leserkommentare // Neueste

[6 Leserkommentare] [Kommentar schreiben]

-paleface- // 00:27 am 16.8.2022

Man kann vermurlich irgendwann unreal engine material per ai zusammen basteln können. Und dann werden auch Filme daraus entstehen.

berlin123 // 15:28 am 15.8.2022

Wird für (Dreh-)Bücher schon dran gearbeitet: frogs42.com Schauen wir mal was da rauskommt. Als Oldschool Variante gibtd das ja für Groschenromanautoren als Morphologischer...weiterlesen

Abercrombie // 14:46 am 15.8.2022

Wird für (Dreh-)Bücher schon dran gearbeitet: http://www.frogs42.com/

Im Forum mitdiskutieren >>

Ähnliche News //

News

VideoFusion: Erste Open Source Video-KI ist da - und läuft auch auf dem Heim-PC

Ein chinesisches Forscherteam hat eine neue Text-to-Video KI veröffentlicht, mit der sich Videos per Texteingabe erzeugten lassen. Ähnliche Algorithmen haben zwar schon Meta mit .....

// 13:41 Mo, 20. Mär 2023von Thomas Richter

News

Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in ...

OpenAI, die Entwickler unter anderem der Text-KI GPT3 und der Bildgenerierungs KI DALL-E 2 haben das Spracherkennungssystem "Whisper" vorgestellt, welches nicht nur gesprochene ...

// 15:28 Mo, 26. Sep 2022von Thomas Richter

News

Microsoft bietet ab sofort kostenlose KI-Bildgenerierung per Edge Browser

Microsoft wittert Morgenluft und sieht KI als große Chance, Marktanteile im von Google dominierten Markt der Internet-Suche und -Browser zu erobern - nun wird nach Bing/GPT 4.0 ...

// 15:34 Sa, 8. Apr 2023von Thomas Richter

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

News

Auto-Photoshop-StableDiffusion-Plugin jetzt mit ControlNet-Unterstützung

Wer eine Kommandozeile nicht gewohnt ist, bleibt meistens bei aktuellen KI-Entwicklungen außen vor. Denn wenn man wissenschaftlichen Code ausprobieren will, so ist dieser ...

// 15:53 Mo, 6. Mär 2023von Rudi Schmidts

zur Newsübersicht >

Das Ende der RAW WARS Blackmagic unterstützt Apple ProRes RAW - nicht nur in Resolve

Dass es irgendwann so kommen musste, war ja fast klar, aber zwei Tage VOR dem Beginn der IBC lässt Blackmagic ziemlich überraschend eine fette Katze aus dem Sack: Das neueste ...

// 09:58 Mi, 10. Sep 2025von Rudi Schmidts

News

Profi-Videofeatures iPhone 17 Pro: ProRes RAW, Genlock, Apple Log 2 und Blackmagic ProDock für Filmer

Apple hat mit dem iPhone 17 Pro und iPhone 17 Pro Max die neueste Generation seiner Pro-iPhone Modelle vorgestellt, die Verbesserungen in den Bereichen Rechenleistung, ...

// 00:30 Mi, 10. Sep 2025von Thomas Richter

News

Direkter FX3 Konkurrent Canon Cinema EOS C50 - Vollformat kompakt mit 7K60p Open Gate RAW Aufzeichnung

Canon ergänzt seine Cinema EOS Reihe um die neue EOS C50. Als bisher kleinste Kamera der Cinema EOS Serie soll sie mit kompakter Bauform und professionellen Funktionen glänzen. ...

// 14:59 Di, 9. Sep 2025von Rudi Schmidts

Test

Neue kompakte Cine-Referenz? Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?

Mit der Nikon ZR präsentiert Nikon die heiß erwartete, erste Version seiner RED RAW Implementierung in einem kompakten Nikon-Vollformat Body. Mit einer UVP von 2.349,- Euro bei 6K ...

// 05:58 Mi, 10. Sep 2025von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Aktuelles

ControlNet - Die nächste Stufe der KI-Bilderzeugung?

Auch wenn die Ergebnisse mittels KI geschaffener Bilder oft bemerkenswert sind - es lässt sich nicht leugnen, dass momentan die Schöpfer der meisten Werke relativ wenig Einfluss ...

// 17:34 Do, 23. Feb 2023von Rudi Schmidts

zur Artikelübersicht >

Aktuelle News //

News

Medien-Management Überraschung: Kyno 1.9 ist erschienen mit Apple Silicon Support und neuem Design

Seit das Medienmanagement-Tool Kyno vor einigen Jahren von Signiant übernommen wurde, lag das Projekt auf Eis – nach vier Jahren Wartezeit ist zur IBC nun tatsächlich das Update .....

// 15:21 Fr, 19. Sep 2025von blip

News

18, 25, 35, 50, 73 und 100mm Leitz Hektor - sechs Cine-Objektive für DSLM & Co vorgestellt

"Charaktervolle" und nicht ganz günstige Vollformat-Objektive bringt Leitz für spiegellose Kameras auf den Markt. Die sechs Cine-Festbrennweiten der neuen Serie HEKTOR – 18, 25, .....

// 11:44 Fr, 19. Sep 2025von blip

zur Newsübersicht >