Meinung  Aus dem Uncanny Valley mitten ins Herz

Aus dem Uncanny Valley mitten ins Herz

Kürzlich hat Roope Rainisto ein KI-Dreambooth Modell für "Realistische Fotos" präsentiert. Und dabei ist uns klar geworden, dass wir mittlerweile einen Kipppunkt bei der Erzeugung realistischer Fotos mittels Künstlicher Intelligenz überschritten haben...

// 11:13 Mo, 28. Nov 2022von

Kürzlich hat Roope Rainisto auf Twitter die Ergebnisse seines KI-Dreambooth Modells für "Realistische Fotos" präsentiert - und dabei ist uns klar geworden, dass wir mittlerweile einen Kipppunkt bei der Erzeugung realistischer Fotos mittels Künstlicher Intelligenz überschritten haben:



 Aus dem Uncanny Valley mitten ins Herz : KI Faces1


Alle diese Bilder wurden von einem neuronalen Netz nach Stichwort-Vorgaben generiert. Keine der dargestellten Personen existiert wirklich, alles ist nur eine stochastische Iteration von Millionen Parametern aus ursprünglichem Rauschen. Dennoch würde kaum ein Betrachter ohne Vorwissen aktuell auf die Idee kommen, dass es sich hierbei um computergenerierte Bilder handelt.



Fotorealistische Bilder ließen sich schon die letzten Jahre immer einfacher erzeugen, jedoch haben die künstlichen Fotos von Roope Rainisto eine neue, zusätzliche Qualität. Sie sind so realistisch, dass sie beim Zuschauer echte Emotionen freisetzen können. Einen Astronauten auf einem Pferd mag man vor allem technisch bewundern, aber solche "echten Fotos von echten Menschen" wecken unvermittelt direkte Emotionen beim Betrachter, was für ein computergeneriertes Bild doch ein Novum ist.



Was war nochmal im Uncanny Valley?

3D-Modellierer hatten in den letzten zwei Jahrzehnten mit der Akzeptanzlücke des Uncanny Valley zu kämpfen. Die Wikipedia erklärt das Problem folgendermaßen:



"Während man zunächst annehmen würde, dass Zuschauer oder Computerspieler ihnen dargebotene Avatare umso mehr akzeptieren, je fotorealistischer die Figur gestaltet ist, zeigt sich in der Praxis, dass dies nicht stimmt. Menschen finden hochabstrakte, völlig künstliche Figuren mitunter sympathischer und akzeptabler als Figuren, die besonders menschenähnlich bzw. natürlich gestaltet sind.


Die Akzeptanz fällt der Theorie zufolge ab einem bestimmten Niveau des Anthropomorphismus schlagartig ab und steigt erst ab einem bestimmten, sehr hohen Grad wieder an. Die Akzeptanz wäre dann am höchsten, wenn sich die Imitationen überhaupt nicht mehr von echten Menschen unterscheiden ließen."



Kurz gesagt, wenn ein computergenerierter Mensch menschenähnlich, aber eben nicht perfekt generiert wurde, so wirkt er auf viele Betrachter abstoßend oder sogar furchteinflößend. Daher war eine gewisse Abstraktion von computergenerierten Charakteren in der Vergangenheit in der Regel zuträglicher als eine möglichst große Ähnlichkeit - sofern diese nicht hundertprozentig perfekt ist.


Auch bei dem KI-Dreambooth Modells für "Realistische Fotos" von Roope Rainisto gelingt aktuell nur durchschnittlich eines von zehn Bildern ohne grobe sichtbare Fehler. Und fast immer wenn die KI daneben liegt, wird das Ergebnis ziemlich creepy:


 Aus dem Uncanny Valley mitten ins Herz : KI Faces2



Gerade weil der Diskriminator - also der wertende Teil des Netzes - beschließt, dass es sich um ein realistisches Foto handelt, ist die Qualität immer nahezu fotorealistisch. Aber das im Motiv Dargestellte kollidiert inhaltlich mit dem gesunden Menschenverstand. Was die misslungenen Ergebnisse meistens ebenfalls recht interessant macht:


 Aus dem Uncanny Valley mitten ins Herz : KI Faces3

Die letzten Bilder zeigen gut, wie ungemütlich man sich im Unacanny Valley fühlen kann. Und umso erstaunlicher ist es, dass wir es nun geschafft haben, dieses Tal tatsächlich auch mal zu überwinden.



Leserkommentare // Neueste
markusG  //  14:45 am 8.12.2022
Gibt auch für lokale Anwendungen solche Webinterfaces für Stable Diffusion: https://github.com/invoke-ai Gibt auch ein bequemes Installationsskript. Das hat aber bei mir nicht...weiterlesen
tom  //  14:14 am 8.12.2022
Das kann man bei den Entwicklern der verschiedenen Bild-KIs - wenn man sich registriert hat man bei allen dreien einige freie Generierungen (bei DALL-E2 und Stable Diffusion...weiterlesen
funkytown  //  13:29 am 8.12.2022
Gibt es einen Link bzw. Webseite wo man diese KI generierten Bilder mal selbst erzeugen kann, bzw. Stichworte eingeben kann?
Ähnliche Artikel //
Umfrage
    Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
RSS Facebook Twitter slashCAM-Slash