Stability AI gab vor wenigen Stunden bekannt, dass nun eine erste Beta-Version von Stable Diffusion 3 zur Verfügung steht. Hierbei handelt es sich um ein leistungsstarkes Text-zu-Bild-KI-Modell, das nun signifikante Verbesserungen in den Bereichen "Leistung bei mehreren Themenanfragen", "Bildqualität" sowie "Rechtschreibung" aufweisen soll.
Obwohl es noch nicht allgemein verfügbar ist, wurde eine Warteliste für interessierte Anwender eröffnet. Während dieser Preview-Phase will Stability AI weitere Erkenntnisse sammeln, um die Leistung und Sicherheit des Modells vor der offiziellen Veröffentlichung zu optimieren.

Die Stable Diffusion 3-Suite umfasst mehrere Modelle mit einer Bandbreite von 800 Millionen bis 8 Milliarden Parametern (8B). Bei 8 Bit Quantisierung sollte damit selbst das größte Modell mit einer 12 GB Grafikkarte problemlos laufen. Es ist gut möglich, dass bei niedriger Quantisierung auch noch kleinere Grafikkarten hierfür ausreichend Speicher bieten können.

// Top-News auf einen Blick:
- Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes
- Blackmagic Camera for Android 2.1 bringt neue Features
- Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen
- Achtung: Verpixelte Videos können wieder kenntlich gemacht werden
- KI-generierte Fake-Trailer: Wie Hollywood an der Irreführung der Zuschauer ...
- Beleuchtung für Foto und Video lernen mit kostenlosem Tool von Google
Stable Diffusion 3 kombiniert eine Diffusionstransformator-Architektur mit Flow Matching. Ein ausführliches Paper hierzu soll in Kürze veröffentlicht werden. Sieht man sich die wenigen, bisher veröffentlichten Bilder auf der Stability-Webseite an, so sticht vor allem die funktionierende Schrift-Einbettung in Bildern hervor.

Lange dauert es in der Regel nicht, bis weitaus mehr Ergebnisse eines neuen Modells im Netz zu finden sind. Wir rechnen jedenfall spätestens zum Wochenende damit...