Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt erstmals die Generierung von Bildern per Textinput auch auf einem normalen PC (mit einer Extra GPU) möglich. Dank Stable Diffusion kann damit jeder/e Interessierte selbst den Zauber von KI-generierten Bildern ausprobieren und sich ein Bild davon machen, wie mächtig solche Algorithmen sind - und vielleicht eine davon Idee bekommen, wie diese neue Technologie in die eigene Arbeit integriert werden kann.

Mittels einer einfachen Texteingabe können Bilder beliebiger Subjekte in verschiedenen Stilen erzeugt werden. Die Bildstile können dabei von realistischen Photographien bis hin zu phantastischen Gemälden im Stile berühmter Maler reichen und die Bildinhalte können sowohl alltägliche Gegenstände in beliebiger Komposition sein, als auch Skulpturen, Städte, (Innen-)Architektur, Landschaften oder neugeschaffene Wesen - der Phantasie sind keine Grenzen gesetzt. Im Gegensatz zu DALL-E2 erlaubt Stable Diffusion sogar Bilder mit bekannten Persönlichkeiten. Und Dank der offenen Lizenz CreativeML Open RAIL-M sind die Bilder des veröffentlichten Modells auch kommerziell nutzbar.

Gute Bilder durch gute Prompts
Etwas Übung erfordert allerdings die Kommunikation mit dem Programm - meist benötigt es eine Reihe von Anläufen, um zu einem gewünschten oder besonders schönen Ergebnis zu kommen. Es hilft beim sogenannten Prompt-Design - einer sich gerade entwickelnden, quasi eigenen Wissenschaft, für das es schon hilfreiche Anleitungen gibt - sich zunächst eine Reihe von Bildern anzusehen, die andere User generiert haben und deren Texteingaben zu studieren, um eine Ahnung zu bekommen von der Bandbreite der möglichen Inputs, die das Aussehen des resultierenden Bildes beeinflussen können.

Praktisch ist es auch, gleich eine Reihe von alternativen Versionen eines Bildes zu generieren, die sich manchmal erstaunlich unterscheiden. Mittels verschiedener Modifikatoren kann das Aussehen eines bestimmten Motivs in die unterschiedlichsten Stilrichtungen verändert werden - hier einige Beispiele.
