Stability AI gab vor wenigen Stunden bekannt, dass nun eine erste Beta-Version von Stable Diffusion 3 zur Verfügung steht. Hierbei handelt es sich um ein leistungsstarkes Text-zu-Bild-KI-Modell, das nun signifikante Verbesserungen in den Bereichen "Leistung bei mehreren Themenanfragen", "Bildqualität" sowie "Rechtschreibung" aufweisen soll.
Obwohl es noch nicht allgemein verfügbar ist, wurde eine Warteliste für interessierte Anwender eröffnet. Während dieser Preview-Phase will Stability AI weitere Erkenntnisse sammeln, um die Leistung und Sicherheit des Modells vor der offiziellen Veröffentlichung zu optimieren.

Die Stable Diffusion 3-Suite umfasst mehrere Modelle mit einer Bandbreite von 800 Millionen bis 8 Milliarden Parametern (8B). Bei 8 Bit Quantisierung sollte damit selbst das größte Modell mit einer 12 GB Grafikkarte problemlos laufen. Es ist gut möglich, dass bei niedriger Quantisierung auch noch kleinere Grafikkarten hierfür ausreichend Speicher bieten können.

// Top-News auf einen Blick:
- Affinity Photo, Designer und Publisher ab sofort in einer kostenlosen App
- DJI Neo 2 bringt Rundum-Hinderniserkennung samt LiDAR
- Künftige Xbox Next: Vollwertiger Windows-PC mit Potenzial für Videobearbeitung
- LG UltraFine 40U990A-W - 40 5K2K Monitor mit Thunderbolt 5
- Neue Firmware für Panasonic LUMIX S5 II, S5 IIX, S9, GH7 und G9 II
Stable Diffusion 3 kombiniert eine Diffusionstransformator-Architektur mit Flow Matching. Ein ausführliches Paper hierzu soll in Kürze veröffentlicht werden. Sieht man sich die wenigen, bisher veröffentlichten Bilder auf der Stability-Webseite an, so sticht vor allem die funktionierende Schrift-Einbettung in Bildern hervor.

Lange dauert es in der Regel nicht, bis weitaus mehr Ergebnisse eines neuen Modells im Netz zu finden sind. Wir rechnen jedenfall spätestens zum Wochenende damit...


















