Schlägt Meta Stable Diffusion XL mit Ästhetik? Emu trainiert "vom Feinsten"

// 10:49 Mo, 16. Okt 2023von Rudi Schmidts

Nachdem Open AI ja gerade mit Dall-E 3 die KI-News beherrscht, holt Meta zum nächsten Streich in der Liga der generativen Diffusions-Modelle aus. Zwar wurde "Emu" noch nicht offiziell angekündigt, jedoch gibt es bereits ein eingereichtes Paper, welches in der Szene nun große Neugier weckt.

Das Paper führt mit Emu letztlich zwei sehr interessante Neuigkeiten ins Feld. Erstens fand Meta bei der Architektur, dass eine Erhöhung der Kanäle im Autoencoder von 4 auf 16 die Rekonstruktion feiner Details signifikant erhöhte. Kleine Schriften bleiben hiermit beispielsweise deutlich lesbar.

Meta"s emu uses 16 channels in the autoencoder and thus obtains more details. — Metas Emu nutzt im Autoencoder 16 Kanäle und erhält damit mehr Details

Die wichtigste neue Erkenntnis durch Emu ist laut Meta jedoch, dass ein überwachtes Feintuning mit einem Satz überraschend kleiner, aber extrem visuell ansprechender Bilder die Generierungs-Qualität erheblich verbessern kann.

So ist Emu ein ziemlich normales, latentes Diffusionsmodell, das anhand von 1,1 Milliarden Bild-Text-Paaren trainiert wurde. Das anschließende Feintuning wurde jedoch mit nur "einigen Tausend" Bildern durchgeführt. Diese waren jedoch sorgfältig aufgrund ihrer "ästhetischen Exzellenz" ausgewählt worden. Mit dieser Strategie "Klasse statt Masse" übertraf das Modell nach einer Open User Einschätzung in 82,9 Prozent aller Fälle sich selbst ohne Finetuning. Auch gegenüber Stable Diffusion XL bevorzugten Anwender in einem Webtest die Ergebnisse von Emu in mehr als 2 von 3 Fällen.

Metas Emu - Generative Image Generator with Aesthetically Curated Fine Tuning — Metas Emu - Generativer Bildgenerator mit ästhetisch kuratiertem Feintuning

Nun bleibt es natürlich spannend, was Meta letztlich mit seinem Modell anfangen wird. Das letzte große Sprachmodell (LLMs) von Meta (LLama) fand schnell seinen Weg in die Hände der Open Source Gemeinde - was nun natürlich auch entsprechende Erwartungen gegenüber Emu aufkommen lässt. Ein paar Tage müssen wir uns allerdings wohl noch gedulden, bis Meta hier seine konkreten Pläne verlautbaren wird.

mehr Infos bei
ai.meta.com

Auf Socials teilen:

Leserkommentare // Neueste

medienonkel // 14:56 am 17.10.2023

Naja initial ging es im Artikel hier auch nicht um Adobe Firefly. Und scheinbar ist man da doch sehr stark eingeschränkt. Karl Klammer gibt's nicht, dafür alles, was open...weiterlesen

MK // 20:56 am 16.10.2023

Ja, aber es macht ja keinen Sinn über die Prompteingabe einer Software zu sinnieren mit der man nicht arbeitet. Gibt es in Stable Diffusion den Karl Klammer...weiterlesen

medienonkel // 18:01 am 16.10.2023

Ach? Naja, bin ja nicht ohne Grund von Adobe weg. Falls ich mal dazu komme, probier ich's mal aus. Ich lass den Spass lieber lokal auf meinem Rechner laufen und kann mit...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

DALL-E 2: KI generiert und editiert Bilder nur anhand von Textbeschreibung

Vor etwas über einem Jahr hatte OpenAI die erste Version von DALL-E gestartet, einem neuronalen Netz, welches Bilder nur anhand einfacher Textbeschreibungen generieren kann. Jetzt ...

// 17:22 So, 10. Apr 2022von Thomas Richter

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

News

Meta Emu Video / Edit - verbessert Konsistenz in generativen KI Videos

Der Bereich der generativen KI entwickelt sich weiterhin mit großen Schritten und Meta stellt sich in letzter Zeit als einer der besonders treibenden Motoren heraus. Ein für ...

// 07:37 Mo, 20. Nov 2023von Rudi Schmidts

News

Kostenlose Bildgenerierung per KI: Stable Diffusion jetzt mit einfachem Installer

Vor kurzem wurde die Text-zu-Bild KI Stable Diffusion veröffentlicht, mit deren Hilfe man kostenlos auf dem eigenen Computer auch zuhause auf dem eigenen PC phantastische Bildern ....

// 11:00 Di, 13. Sep 2022von Thomas Richter

News

Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion

Microsoft hat ein neues, freies Tool namens Olive vorgestellt, welches vielen KI-Modellen wie zum Beispiel Stable Diffusion ermöglicht, automatisch die Hardwarebeschleunigung von ....

// 18:08 Mi, 24. Mai 2023von Thomas Richter

zur Newsübersicht >

Unterstützung für mehr Handys Kostenlose Blackmagic Camera App 1.1 für Android bringt viele neue Funktionen

Vor rund einem Monat hatte Blackmagic seine kostenlose Camera App auch für Android veröffentlicht, jetzt ist bereits das erste Update erschienen, das zahlreiche neue Funktionen ...

// 14:17 Mo, 22. Jul 2024von Thomas Richter

News

Nicht nur 3D Animation Blender 4.2 LTS - kostenloses 3D-Softwarepaket jetzt mit GPU-Compositor

Das quelloffene 3D-Modelling- und Animations-Paket Blender wächst weiter. In der neuen Version 4.2 LTS sind sogar ziemlich relevante Verbesserungen für die Videobearbeitung ...

// 11:50 Sa, 20. Jul 2024von Rudi Schmidts

News

6K bzw. 8K 60p RAW Video Canon EOS R1 und R5 Mark II vorgestellt mit DIGIC Accelerator und mehr

Gleich zwei neue Spitzenmodelle für sein EOS R-System präsentiert Canon heute - die EOS R1 und EOS R5 Mark II bringen beide verbesserte Autofokus-Fähigkeiten sowie eine erweiterte ...

// 12:05 Mi, 17. Jul 2024von blip

News

APS-C Wechselobjektivkamera Kompakte Sony ZV-E10 II mit 10bit 4K 60p und Kinolook-Funktionen angekündigt

Sony verbessert seine kleine "Vlogging"-Kamera ZV-E10 - so verfügt die neue Generation II (wie im Vorfeld gemunkelt) über einen neuen Sensor, Dank welchem nun 4K-Videoaufnahmen ...

// 17:23 Mi, 10. Jul 2024von blip

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

zur Artikelübersicht >

Aktuelle News //

News

Geleakte Liste Runway Gen-3 Video-KI wurde an tausenden, ausgesuchten YouTube-Videos trainiert

KI-Videomodelle werden zunehmend besser, die Qualität ihres Outputs hängt bekanntlich jedoch stark von dem Videomaterial ab, anhand dessen sie lernen, wie Videos auszusehen haben. ...

// 17:13 Fr, 26. Jul 2024von blip

News

Mit besseren Kameras? Neue Drohnen im Anflug: Erst DJI Air 3S, dann Mavic 4?

Schon seit Mai kursieren Gerüchte über ein neues Drohnenmodell von DJI: zunächst drehten sich die Leaks der bekannten Accounts @OsitaLV und @Quadro_News um vereinzelte Abbildungen ...

// 19:14 Do, 25. Jul 2024von Thomas Richter

zur Newsübersicht >