StableRep nennt sich die neue Trainingsmethode die von MIT und Google Forschern entwickelt wurde und bei der neuronale Netze mit synthetisch generierten Text-Bild-Daten trainiert werden. Bislang mussten neuronale Netze mit gewaltigen Bilddatenbanken trainiert werden, wobei diese Bilder aus der realen Welt stammten und bereits entsprechend verschlagwortet waren, um Bild und Wort zu einer „Bedeutung“ zusammenzufassen. State of the Art Methoden hierzu sind die bekannten SimCLR oder CLIP Modelle.

Doch dies ändert sich gerade ziemlich fundamental. Mit StableRep lassen sich generative KI Modelle wie Stable Diffusion jetzt auch quasi durch KI selbst – bzw. durch künstlich generierte Bilddaten trainieren – und dies um einiges effizienter und mit besseren Ergebnissen als mit Bildern aus der realen Welt.
Der entscheidende Satz hierbei lautet:
"StableRep, trainiert mit 20 Mio. synthetischen Bildern, erreicht eine bessere Genauigkeit als CLIP, trainiert mit 50 Mio. realen Bildern".
// Top-News auf einen Blick:
- YouTuber verliert Prozess - Bruce Willis Synchronstimme darf nicht geklont werden
- Preview auf objektbasierte Maskentools in der Premiere Pro Beta
- Blackmagic DaVinci Resolve Studio ab sofort auch mit monatlicher Lizenz
- Neu und kostenlos - Adobe Premiere für iPhone
- Canon teasert neue, kompakte Kamera - Cine-Modell zur IBC?
- Revolutionärer AF für Cine-Objektive: Tilta Autofokus-Adapter zapft interne Kamera-...
Der Schlüssel hierzu nennt sich „multi-positive contrastive learning“ und bedeutet in diesem Zusammenhang, dass das zu trainierende, neuronale Netzwerk einen Textprompt mit mehreren daraus generierten Bildern als valide, kontrastierende Ergebnisse gewichtet und lernt. Durch die Kontrastierung entsteht vermutlich so etwas wie die bildhafte Essenz einer Bedeutung. Variationen können so viel schneller selbst diagnostiziert und ausgegeben werden.
Die Implikationen hieraus können recht weitreichend sein, well damit quasi eine KI durch eine KI trainiert wird und damit ein geschlossener Kreislauf entsteht, in dem es nicht mehr den Input von Menschen benötigt. Damit könnte sich KI um ein Vielfaches schneller selbst weiterentwickeln.
Willkommen in der Zukunft ...