CM3leon - neue generative Bild-KI verspricht präzisere Gestaltungsmöglichkeiten

// 10:18 Fr, 28. Jul 2023von blip

Meta hatte im April bereits ein ziemlich mächtiges KI-Modell zur Erstellung von Objektmasken vorgestellt, Segment Anything (SAM). Wenig überraschend arbeitet das Unternehmen auch an einem eigenen KI-Bildgenerator und verfolgt dabei einen ungewöhnlichen Ansatz. Das kürzlich vorgestellte, multimodale Modell CM3leon (auszusprechen wie das Tier) unterstützt nämlich sowohl eine Text-zu-Bild- als auch eine Bild-zu-Text-Generierung und setzt auf eine Transformer-Architektur. Letzteres kennt man bisher eher von KI-Systemen zur Texterstellung, während die bildgenerierende Konkurrenz (DALL-E, Stable Diffusion uä.) auf Diffusionsmodellen beruht. Dort wird ein Bild nach und nach aus Bildrauschen destilliert.

CM3Leons Systemarchitektur dagegen basiert auf einem decoder-only Transformer und wird sowohl an Bild- als auch an Text-Tokens trainiert (die verwendeten Bilder wurden von Shutterstock lizensiert). Daher ist das Modell laut Meta sehr gut darin, komplexe Bilder anhand eines detaillierten Prompts zu generieren (siehe das Kaktus-Beispiel unten), ebenso kann es Bildinhalte beschreiben und Bilder gezielt nach Texteingaben manipulieren.

Das Modell selbst ist noch nicht freigegeben, Meta stellt jedoch einige Bildbeispiele zur Verfügung. So wurden die folgenden Bilder aus diesen vier Prompts generiert:

(1) Ein kleiner Kaktus mit Strohhut und Neon-Sonnenbrille in der Wüste Sahara. (2) Eine Nahaufnahme einer menschlichen Hand, Handmodell. Hohe Qualität. (3) Eine Waschbär-Hauptfigur in einem Anime, die sich auf einen epischen Kampf mit einem Samurai-Schwert vorbereitet. Kampfhaltung. Fantasy, Illustration. (4) Ein Stoppschild im Fantasy-Stil mit der Aufschrift "1991".

Image examples generated by CM3Leon — Von CM3Leon generierte Bildbeispiele

// Top-News auf einen Blick:

Menschliche Hände waren (und sind z.T. noch) sehr schwierig für bisherige Bildgeneratoren umzusetzen, insofern sind diese Resultate schon ziemlich beeindruckend. Auch die Bildbearbeitung per Textkommando funktioniert grundsätzlich seht gut, wie folgendes Beispiel zeigt - für die Aufgabe sind keine weiteren Zusatztools nötig, die Funktionalität ist direkt im (multimodalen) Modell angelegt. So ist es dann natürlich auch kein weiter Schritt mehr, dem CM3Leon-Modell Bildbeschreibungen in Textform zu entlocken.

Image manipulation via text command — Bildmanipulation per Textkommando

Vielversprechend hinsichtlich eines professionellen Einsatz dieser KI-Bildtechnologien ist ein sogenanntes "Structure-guided image editing", bei dem CM3leon beim Bildediting auch Informationen hinsichtlich der Bildstruktur berücksichtigen soll; leider gibt es dafür keine Bildbeispiele. Gezeigt wird dagegen, wie das Modell vorgegebene Objekte an spezifische Bildkoordinaten setzt bei der Bilderstellung, was eine Vorstellung davon gibt, wie gezielt man mit diesem Modell gestalten könnte:

Beim Vorgehen "Segmentation-to-image" wiederum nimmt CM3leon eine Alphamaske als Input und generiert ein Bild, das den jeweiligen Umriss enthält (und schließt damit quasi an das Segment Anything-Modell an).

Während die von Meta gezeigten Bilder (noch) nicht den Grad an Fotorealismus aufweisen, den die Konkurrenz zT. beherrscht, ist eine beeindruckende Vielseitigkeit und Funktionalität in diesem multimodalen Modell enthalten. Wir sind gespannt, wann und wie es in Zukunft zur Verwendung veröffentlicht wird.

mehr Infos bei
ai.meta.com

Auf Socials teilen:

Leserkommentare // Neueste

medienonkel // 19:16 am 28.7.2023

Sehr schön. Aber die Hand braucht dringend einen Gips 😉

Im Forum mitdiskutieren >>

Ähnliche News //

News

Adobe führt Credit-basiertes Modell für generative KI ein (und die Creative Cloud ...

Zur IBC präsentierte Adobe aktuelle Beta-Versionen von Premiere Pro und After Effects mit interessanten Neuigkeiten, wie bereits beschrieben. Zeitgleich wurden auch die neuen ...

// 18:59 Mo, 18. Sep 2023von blip

News

KI-Tools, Keyframe-Editor etc. Blackmagic DaVinci Resolve 20 mit über 100 (!) neuen Funktionen vorgestellt

Neben der neuen Pyxis 12K hat Blackmagic natürlich auch das traditionelle Frühjahr-Update seines kostenlosen Grading-, Schnitt-, Compositing- und Audio-Mastering-Programms DaVinci ...

// 22:20 Fr, 4. Apr 2025von blip

News

Grosses Upgrade Blackmagic veröffentlicht finale Version von DaVinci Resolve 20

Nach nur vier Beta-Versionen, in denen die neuen Funktionen Stück für Stück eingeführt und eventuelle Probleme ausgemerzt wurden, hat Blackmagic jetzt das vor knapp 2 Monaten ...

// 10:40 Mi, 28. Mai 2025von Thomas Richter

News

De-Compositing Generative Omnimatte: KI zerlegt jedes Video in Ebenen-Objekte

Wir haben uns ja schon daran gewöhnt, dass KI es mittlerweile ziemlich überzeugend schafft, einzelne Instrumenten-Tracks aus komplett gemasterten Stereo-Songs zu extrahieren. Also ...

// 11:43 Di, 26. Nov 2024von Rudi Schmidts

News

Generative KI am Handy Mobile Adobe Express Beta-App bekommt Firefly-Funktionen

Bereits seit letztem Jahr lassen sich in Adobe Express KI-Funktionen nutzen, allerdings nur am Desktop. Nun ist auch in den mobilen Betaversionen der All-in-One-App die generative ...

// 17:13 Mo, 11. Mär 2024von blip

zur Newsübersicht >

KI-Boom trifft SSD-Markt Leak: Samsungs plant SATA-Aus - Kommt der Preisschock auch bei SSDs?

Neuen Gerüchten von MooresLawIsDead zufolge will Samsung aus der Produktion von SATA-SSDs aussteigen; angekündigt werden soll dies im Januar. Ein solcher Schritt hätte kurz- und .....

// 19:11 Mo, 15. Dez 2025von Thomas Richter

News

Anstieg bei Kameraverkäufen Kompaktkameras wieder im Trend - trotz Smartphones

Als im April unerwartet viele DSLMs verkauft wurden - 36% mehr als im Vorjahresmonat -, stellte sich die Frage nach einer möglichen Trendwende auf dem Kameramarkt. Ob sich die ...

// 15:32 Mo, 15. Dez 2025von blip

News

FPV-Flugerlebnis ganz neu Antigravity A1 - die erste 360° Drohne ist da

Insta360 hatte die Antigravity ja schon im August angekündigt - Gerüchten nach sollte sie im Januar erscheinen, aber durch DJIs bevorstehenden Start der eigenen Rundumsicht-Drohne ...

// 18:54 Do, 4. Dez 2025von Thomas Richter

News

Kamera-Deals Bis zu 1.000 Euro sparen: Cashbacks auf Kameras von Sony, Nikon, Canon und Panasonic

Es muss nicht immer ein Black Friday Deal sein: das ganze Jahr über laufen von großen Kameraherstellern verschiedene Aktionen - auch jetzt im Herbst und Winter. Diese wollen wir .....

// 20:26 Do, 27. Nov 2025von Thomas Richter

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Ratgeber

Echte Cloud-Alternativen? Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...

Wer die Entwicklung aktueller Video-KI-Modelle verfolgt, sieht fast jeden Tag neue Sensationen. Da liegt es nahe, auch einmal selbst Hand anzulegen, um eigene Erfahrungen mit der ...

// 11:35 Di, 15. Apr 2025von Rudi Schmidts

Praxis

Mattepainting für Dummys - mit Photoshops Generative Fill Funktion

Wir hatten schon einmal kurz auf Photoshops "Generative Fill"-Möglichkeiten im Zusammenhang mit Videoaufnahmen hingewiesen. In diesem Workshop möchten wir zeigen, wie die ...

// 13:26 Mi, 16. Aug 2023von Rudi Schmidts

zur Artikelübersicht >

Aktuelle News //

News

Statement zum Jahresende ARRI blickt optimistisch in die Zukunft - und lagert Lichtproduktion aus?

Das Jahr 2025 wird bei ARRI nicht als das allerbeste in die über hundertjährige Firmengeschichte eingehen - laut unbestätigten, aber auch nicht dementierten Angaben werden ...

// 15:38 Di, 16. Dez 2025von blip

News

Neuer DJI RS 5 Profi-Gimbal kommt bald mit intelligentem Tracking und Turbo-Ladefunktion

Neues Leak Neuer DJI RS 5 Profi-Gimbal kommt bald mit intelligentem Tracking und Turbo-...

Der bekannte DJI-Leaker Igor Bogdanov hat sowohl neue Bilder als auch Infos zur nächsten Generation von DJIs (semi-)professioneller Gimbalserie Ronin veröffentlicht, die darauf ...

// 12:56 Di, 16. Dez 2025von Thomas Richter

zur Newsübersicht >