Wenn man über aktuelle Fortschritte bei generativen KI-Modellen berichtet fällt es gelegentlich schwer, nicht den Begriff "Gamechanger" zu bemühen. Beim aktuellen Entwicklungsfortschritt von Stable Diffusion fällt es sogar ausgesprochen schwer, denn was das Team von Stabilty AI zuletzt präsentiert hat, gibt es bei der versammelten Konkurrenz so noch nicht zu entdecken.
So wurde mit Stable Diffusion XL Turbo (kurz SDXL-Turbo) ein neuer Algorithmus ins Spiel gebracht, welche die Generierung von Bildern mal eben um den Faktor 10x bis 40x beschleunigt. Das klingt nicht nur unglaublich, sondern ermöglicht daraufhin auch ein komplett anderes Arbeiten mit Prompts.
So können bei der Arbeit mit ComfyUI - dem aktuell angesagtesten Interface für Stable Diffusion - mit schnellen GPUs Bilder im Sekundentakt ausgegeben werden. Also praktisch in Echtzeit, noch während man seinen Prompt tippt. So sieht man sofort, welche Veränderungen auch nur ein Buchstabe mehr oder weniger im Prompt bewirkt:
Wer es selbst einmal kurz kostenlos ausprobieren will, kann direkt hier bei Stability AI einen Online-Prompt nutzen. Aber Achtung, die Nutzung sollte mit Bedacht erfolgen - denn die kostenlosen Versuche sind hier nach ca. 30 Aktionen bereits "aufgebraucht".
// Top-News auf einen Blick:
- Erste Black Friday Angebote von Atomos, Nanlite, DZOFILM und mehr
- SanDisk stellt Extreme Fit vor: Aktuell kleinster 1TB USB-C-Speicherstick
- Apple plant OLED-MacBook Pro, Mac Studio M6 Ultra und Mini-LED Studio Display
- DJI Avata 360 - Leaks zeigen DJIs neue 360°-Drohne
- ARRIs Color KnowHow könnte Millionen Wert sein - als Workflow Lizenz für Dritte
- Canon EOS C50 im Praxistest: Kompaktes Arbeitstier mit 7K 50p Raw - die neue FX3 Konkurrenz
Wer sich für genaue Funktionsweise des neuen Algorithmus interessiert, der findet hier das entsprechende Paper zur "Adversarial Diffusion Distillation". Die neue ADD-Idee scheint dabei Anleihen bei Generative Adversarial Networks (GANs) zu nehmen.

Wer SDXL Turbo selbst installieren und betreiben will, dem seien noch folgende Geschwindigkeits-Datenpunkte ans Herz gelegt: Mit einer Nvidia RTX 3060 darf man erwarten, dass Bilder mit 1.024 x 1.024 Pixeln Auflösung nach drei Schritten in ca. 4 Sekunden fertig sind. Auf einer Nvidia A100 dauert ein 512 x 512 Pixel großes Bild laut Stability AI nur ca. 200 Millisekunden. Und hier kann man sich auf Reddit ansehen, wie SDXL Turbo auf einer RTX 4090 flutscht.
Doch damit scheint nicht einmal vorerst das Ende der Fahnenstange erreicht. Vielmehr scheint das Rennen dank Open Source erst eröffnet. Heute Nacht tauchte auf Reddit mit ArtSpew frischer Code auf, der 149 Bilder (512 x 512) pro Sekunde auf einer RTX 4090 erzeugen kann.

















