Logo Logo
/// News

DALL-E 3 ist da und generiert exaktere KI-Bilder inkl. Text dank ChatGPT-Integration

[13:37 Do,21.September 2023 [e]  von ]    

OpenAI hat die neueste Version seines diffusionsbasierten KI-Bildgenerators DALL-E vorgestellt - er ist nun eng mit ChatGPT verzahnt, was gleich mehrere Vorteile bringt. So sollen Prompt-Vorgaben viel genauer befolgt werden als bisher und auch die Darstellung von Text in den generierten Bildern besser gelingen.

dallE3_generierteBilder
Von DALL-E 3 generierte Bilder


Tatsächlich heißt es, DALL-E 3 sei "built natively on ChatGPT", wobei es zur Modell-Architektur oder dem Training leider keine genauen technischen Deteils gibt. Durch den irgendwie multimodalen Ansatz entsteht ein anderes Verhältnis zwischen Sprache und Bild, was unter anderem in mehr Einfluss auf die Bildgeneration resultiert.



DALL-E 3 wird sogar direkt im Interface von ChatGPT laufen, sodass der Textgenerator gleich die genauen Prompts ausformulieren kann. Man müsse sich nur ein Bild wünschen und ChatGPT agiere dann als Vermittler zu DALL-E 3. Ein umständliches Prompt-Engineering gehöre damit der Vergangenheit an, so OpenAI. Wer möchte, kann natürlich auch selbst eine ausführliche Beschreibung seiner Bildidee eingeben.

Die von OpenAI ausgewählten Beispielsbilder - derzeit ist DALL-E 3 noch in einer geschlossenen Beta - zeigen in der Tat eine große Nähe zwischen Prompt und generiertem Bild:

dallE3_moonstreet


Das folgende Bild wiederum basiert auf diesem Prompt - man beachte übrigens auch die tadellose Darstellung der Hände: "A middle-aged woman of Asian descent, her dark hair streaked with silver, appears fractured and splintered, intricately embedded within a sea of broken porcelain. The porcelain glistens with splatter paint patterns in a harmonious blend of glossy and matte blues, greens, oranges, and reds, capturing her dance in a surreal juxtaposition of movement and stillness. Her skin tone, a light hue like the porcelain, adds an almost mystical quality to her form."

dallE3_plategirl


Auch Text wird korrekt eingefügt, hauptsächlich wenn er im Prompt wörtlich vorgegeben wird; dies hat zuvor nicht geklappt.

dallE3_avocado_empty


Grundsätzlich läßt sich auch in Bildern von DALL-E 3 noch Kauderwelsch finden. So enthielt der Prompt für das folgende Poster die Vorgabe "The bottom text reads, Explore Venus: Beauty Behind the Mist" - das wurde großteils, aber nicht ganz übernommen, während das Kleingedruckte wie zuvor frei fabuliert wurde.

dallE3_explore_venus


Laut OpenAI sind mehrere Filter im neuen KI-Bildgenerator implementiert, nicht nur um die Darstellung von Gewalt u.ä. zu verhindern. Es soll demnach ebenso wenig möglich sein, Bilder von bekannten Persönlichkeiten zu erstellen, zumindest indem ihr Name im Prompt genannt wird. Auch sollen sich keine Bilder mehr im Stile von noch lebenden Künstlern generieren lassen. Darüberhinaus soll das Unternehmen an einer internen Kennung arbeiten, um künftig erkennen zu können, welche Bilder mit DALL-E 3 generiert wurden.

DALL-E 3 soll Anfang Oktober für ChatGPT Plus und Enterprise Kunden zugänglich werden (also kostenpflichtig).

Link mehr Informationen bei openai.com

  
[4 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
markusG    13:57 am 22.9.2023
Naja für Text gibt es zumindest Workarounds... https://www.youtube.com/watch?v=_6q5FQIRzAs
Frank Glencairn    10:17 am 22.9.2023
Ich glaub das liegt daran, daß das ganze nicht auf Text und Fonts basiert, sondern nur auf Bildern die es irgendwo gesehen hat. Eigentlich müßte da für Texte ne zweite "Ebene"...weiterlesen
MK    09:01 am 22.9.2023
Komisch dass die alle so große Probleme mit Textwiedergabe haben... man sollte meinen dass das bei der ganzen Sache das Einfachste wäre.
[ Alle Kommentare ganz lesen]

  Vorige News lesen Nächste News lesen 
bildDatacolor Spyder Checkr Video - Neue Farbreferenzkarte für Videoanwendungen bildYouTube: neue Editing-App verfügbar - und bald kommen die Video-KI-Tools


verwandte Newsmeldungen:
KI:

Meta Emu KI-Bildgenerator - online kostenlos, jedoch aktuell nur in den USA 7.Dezember 2023
SDXL-Turbo - Neuer KI-Algorithmus beschleunigt Stable Diffusion extrem 6.Dezember 2023
PIKA 1.0 angekündigt - Generative KI-Videos mit erstaunlicher Qualität 29.November 2023
Der nächste Schritt ist da: KI trainiert KI (und braucht den Menschen nicht mehr) 28.November 2023
Insta360 Ace Pro - Action Cam mit 8K-Sensor, Leica Optik und viel KI 24.November 2023
Stable Video Diffusion - Freies KI-Diffusionsmodell zur Videoerzeugung vorgestellt 23.November 2023
Boris FX: Continuum bekommt KI-Funktionen - Denoiser und Upscaler 21.November 2023
alle Newsmeldungen zum Thema KI


[nach oben]

















passende Forenbeiträge zur News:

Archive

2023

Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2022
Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

2005

2004

2003

2002

2001

2000






































update am 10.Dezember 2023 - 12:02
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*