Aktuelles

ControlNet - Die nächste Stufe der KI-Bilderzeugung?

Auch wenn die Ergebnisse mittels KI geschaffener Bilder oft bemerkenswert sind - es lässt sich nicht leugnen, dass momentan die Schöpfer der meisten Werke relativ wenig Einfluss auf das Ergebnis hatten. Doch das dürfte sich schon bald ändern...

// 17:34 Do, 23. Feb 2023von Rudi Schmidts

Als Eingabe erwarten Modelle wie Stable Diffusion, Midjourney oder DALL-E 2 bislang entweder ein bereits vorhandenes Bild (pic2pic) oder eine Texteingabe (text2pic), mittels derer ein Bild generiert wird. Doch eigentlich sind diese Eingabe-Texte und -Bilder "nur" Koordinaten in einem Raum mit sehr vielen Dimensionen, dem sogenannten Latent Space. Ein entsprechender Eingabe-Satz (der sogenannte Prompt) deutet also nur auf einen Punkt in diesem Latent Space, der anschließend das Bild durch eine sehr große, aber feste Formel mit diesen Koordinaten als Parameter erzeugt.

Ist nur ein einziges (Satz)-Zeichen im Prompt anders, so zeigt dieser auf eine ganz andere Stelle im Latent Space und errechnet somit auch ein komplett anderes Bild. Zudem bestimmt eine Startzufallszahl (die sogenannte Seed) wie das Rauschen erstellt wird, das den Ausgangszustand der Bildberechnung darstellt. Ändert man auch nur nur eine Ziffer in der Seed, erhält man ebenfalls ein komplett anderes Bild.

Mehr Zufall als Kontrolle

Die bisherige Arbeitsweise mit KI-Bildgeneratoren besteht also darin, beim Prompting viele Kombinationen auszuprobieren und irgendwann mit einem ausgespuckten Ergebnis zufrieden zu sein. Will man beispielsweise eine bestimmte Körperhaltung oder einen Kamerawinkel im Bild haben, so muss man dies bei der Texteingabe beschreiben und hoffen, dass die KI das auch entsprechend deutet - was keineswegs selbstverständlich funktioniert, sondern in der Regel eher daneben geht. Auch wenn man ein Bild als Input verwendet, ist es keineswegs sicher, dass die KI beispielsweise auch dessen Kamerawinkel übernimmt. Die Erzeugung ist also aktuell sehr stark von Trial and Error bestimmt und für jedes gelungene Bild, das medial bestaunt werden kann, wurden in der Regel zuvor hunderte misslungene Versuche verworfen. In den meisten Fällen landet man zwar irgendwann bei einem überraschend guten Ergebnis, jedoch war dessen konkrete Bildkomposition meistens keineswegs vom Anwender vorher exakt geplant...

Doch genau dies könnte sich nun mit ControlNet ändern, das seit einigen Tagen durch die StableDiffusion-Community geistert. Control Net erlaubt es, den Text Prompt mit einem zusätzlichen Bild zur Erläuterung der eigenen Idee zu füttern. Und damit eine Richtung der Bildkomposition vorzugeben, wie Gegenstände und Menschen im Bild angeordnet sein sollen.

Gamechanger durch mehr Kontrolle?

Die bislang veröffentlichten Beispiele zeigen bereits deutlich das Potential dieser neuen Technologie und in den Kommentaren fiel seit längerem auch mal wieder der Begriff "Gamechanger". Doch zurecht?

Nach allem, was wir bisher gesehen (und selbst ausprobiert haben), erweitert ControlNet die Möglichkeiten der KI-Bilderzeugung deutlich. Allerdings muss man zur Bedienung (noch) von Hand speziell angepasste Modelle einbinden. Diese Modelle bestimmen, an welcher Art von Bildvorlagen sich ControlNet anschließend orientieren soll. Hier kann man beispielsweise ein "Scribble Modell" wählen, welches einfache Skizzen als Input akzeptiert:

ControlNet - Die nächste Stufe der KI-Bilderzeugung? : Scribble

Oder ein Modell für Strichmännchen-Posen:

ControlNet - Die nächste Stufe der KI-Bilderzeugung? : Posing

Oder ein Modell mit Z-Puffer Tiefeninformationen als Input:

ControlNet - Die nächste Stufe der KI-Bilderzeugung? : Depth

Wer etwas Zeit mitbringt, kann ControlNet aktuell selbst auf Hugginface online ausprobieren - sogar ohne auf seinem Rechner etwas installieren zu müssen. Die dort kostenlos zur Verfügung gestellte Umgebung ist allerdings bei der Berechnung der Prompts ziemlich langsam und benötigte bei uns pro Änderung mindestens zwei Minuten Rechenzeit. Dies Zeiten sind jedoch stark davon abhängig, wie viele Nutzer aktuell mit ControlNet herumspielen.

Nächste Seite >>

Bequemer Einstieg

Leserkommentare // Neueste

MK // 12:23 am 3.3.2023

Goofy-Ohren-Gummibärchen-Stormtrooper aus Entenhausen auf der Reeperbahn? :D

rudi // 10:28 am 3.3.2023

Das war mein zweiter Versuch beim herumspielen in Control Net -nach 5 Minuten! Ich wüsste nicht, wie lange jemand anders in Blender für so ein Bild brauchen würde. (ich würde...weiterlesen

medienonkel // 16:24 am 28.2.2023

Geht so, ist schon auch Geschmackssache. Ich kenne genügend Leute, die meiner Meinung nach weder Technik beherrschen, noch ein Auge haben, sich aber dumm und dämlich verdienen...weiterlesen

Im Forum mitdiskutieren >>

slashCam Bestenliste Die besten DSLMs für Video 2025: Blackmagic, Sony, Nikon, Canon, Panasonic ...

Mit der Sony FX2, der Canon EOS R5 Mark II sowie der Panasonic S1II, S1RII und GH7 haben wir zahlreiche neue Kameras getestet, die viel Bewegung in unser "Beste DSLM für Video" ...

// 12:34 Mo, 11. Aug 2025von Rob

Test

Kameratests auf einen Blick Die besten Kameras 2023: Welche Kameras haben uns in diesem Jahr besonders beeindruckt?

Acht Kameras haben es auf unsere Liste der besten Kameras 2023 geschafft. Tatsächlich könnten die Kameras kaum unterschiedlicher sein: Von kostenlos bis 70.000 Euro, von Ultra-...

// 09:10 Sa, 23. Dez 2023von Rob

Test

Apple Log + Blackmagic Cam App Apple iPhone 15 Pro Max im Praxistest: 10 Bit Apple Log - Gamechanger für Smartphone-Filmer?

Mit der iPhone 15 Generation hat Apple hochspannende Funktionen - insbesondere auch für Filmer - vorgestellt: Fünfach-Zoom, erstmalig USB-C, externe SSD-Aufnahme, Apple Log und ...

// 14:51 Do, 12. Okt 2023von Rob

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

Wissen

Wichtige KI-Begriffe einfach erklärt - Was bedeutet Seed und wofür braucht man das?

Nein, Generative KI geht ganz sicher nicht mehr weg und darum ist es sicherlich niemals zu früh, sich mit den Basics vertraut zu machen. Wie beispielsweise mit dem sogenannten ...

// 09:33 Di, 11. Apr 2023von Rudi Schmidts

Praxis

Effektives Prompting für KI-Videos mit Adobe Firefly

Remote Edit Praxis Slashcam Interviewsetup im Test: Sony FX2, iPhone Pro Max, Blackmagic Cloud, Nanlite PICO

Wir haben unsere Interview-Berichterstattung von der IBC 2025 erneut genutzt, um neue Hardware und neue Workflows auszuprobieren. Diesmal drehte sich alles um die neue Sony FX2, ...

// 11:00 Di, 30. Sep 2025von Rob

Test

Gut genug für Pro? MacBook Air M3 13" im Performance-Test mit Arri, Sony, Panasonic, Canon und Blackmagic

Mit dem Macbook Air M3 in der 13" Ausführung haben wir den derzeit kompaktesten und leichtesten Laptop von Apple getestet. Wir wollten wissen, wie gut Apples ultra-mobiles ...

// 12:06 So, 7. Apr 2024von Rob

zur Artikelübersicht >

Kostenlose Profi-Kamera-App Blackmagic Camera for Android 3.2 bringt H.265-, SRT-Streaming und mehr

Blackmagic hat wieder eine neue Version seiner kostenlosen professionellen Camera App für Android veröffentlicht. Die Version 3.2 bringt mehrere Funktionen, die vor allem Live-...

// 15:18 Do, 27. Nov 2025von Thomas Richter

Aktuelles

Community-Umfrage Sony und slashCam verlosen eine FX2 Cinema Line Kamera

Weihnachten steht vor der Tür - und Sony hat ein besonderes Geschenk für die slashCam Community in Petto: Wer Glück hat, kann sich demnächst eine Sony FX2 unter den Baum legen. ...

// 22:13 Mo, 1. Dez 2025von slashCAM

Test

Die beste Einsteiger-Drohne? DJI Neo 2: Verbesserte Mini-Drohne für Solo-Creator und Einsteiger

Mit der Neo 2 stellt DJI seine weiterentwickelte Einsteiger- und Selfie Drohne Neo 2 vor. Hinzugekommen sind wichtige Funktionen wie Hinderniserkennung, verbessertes Active Track, ...

// 14:39 Do, 27. Nov 2025von Rob

Test

Halbe Portion? Blackmagic PYXIS 12K - Sensor-Test - Rolling Shutter und Dynamik

Die PYXIS Serie bedient den Wunsch vieler Anwender nach einer riggingfähigen Boxed-Kamera. Mit der PYXIS 12K findet nun der Sensor aus der großen URSA CINE 12K in diesem kleineren ...

// 10:47 Di, 25. Nov 2025von Rudi Schmidts

TOP THEMEN //

MEHR ARTIKEL

zur Artikelübersicht >

PASSENDE DISKUSSIONEN

zum Forum >>

Aktuelle News //

News

Multimodale KI-Modelle ByteDance Vidi2 produziert selbstständig fertige Videos aus Rohmaterial

Chinas ByteDance eröffnet den Dezember KI-Präsentationsreigen und demonstriert mit Paper und Demo ihr neuestes multimodales KI-Modell Vidi 2. Multimodale Modelle akzeptieren ...

// 15:54 Mo, 1. Dez 2025von Rudi Schmidts

News

Bessere MetadatenOrga Blackmagic DaVinci Resolve 20.3 bringt Support für 32K-Workflows und mehr

Blackmagic hat gerade die neue Version 20.3 seines kostenlosen Grading-, Schnitt-, Compositing- und Audio-Mastering-Programms DaVinci Resolve (Studio) veröffentlicht. Die neue ...

// 12:39 Mo, 1. Dez 2025von Thomas Richter

zur Newsübersicht >

zum Forum >>

Neueste Artikel //

Aktuelles

Community-Umfrage Sony und slashCam verlosen eine FX2 Cinema Line Kamera

Weihnachten steht vor der Tür - und Sony hat ein besonderes Geschenk für die slashCam Community in Petto: Wer Glück hat, kann sich demnächst eine Sony FX2 unter den Baum legen. ...

// 22:13 Mo, 1. Dez 2025von slashCAM

Aktuelles

Aktuelle Sparangebote Große Übersicht - Black Friday Deals 2025 für Foto+Video - Kameras, Objektive, Zubehör usw.

Heute ist der offizielle Black Friday. Wir haben alle unsere bisherigen Rabatt-News mit aktuellen Angeboten in einer Liste zusammengefasst, um Euch das Finden interessanter Deals ...

// 14:42 Fr, 28. Nov 2025von slashCAM

zur Artikelübersicht >