Beitrag
von andieymi » Di 29 Nov, 2022 16:43
Fotografie ist - auch um den Begriff uncanny valley zu nutzen ein tricky Medium: Es gibt da viel mehr zu Robotik, 3D-Animationen (vs. 2D!) und letztendlich Games, letztendlich war sogar in der fotorealistischen Malerei vieles möglich, was nicht unter uncanny valley fällt, aber absolut fotorealistisch ist.
Das wird jetzt so eine Mittelstufe sein: Die AI hat gelernt - also ganz unkünstlich, machine learning ist eigentlich der Begriff, was anhand von Fotos von Personen normal aussieht. Dies allerdings - darauf zielt der Begriff letztendlich eher ab, weil die Schwierigkeiten da erst so richtig beginnen - für Games und Performances ("Schauspieler") nutzen zu können wird Ai noch viel zu lernen haben.
Menschliche Mimik ist quasi unendlich komplex, erst recht wenn man eine zeitliche Komponente hinzufügt und nicht nur mit Standbildern arbeitet. Jede "Ungenaugikeit" der AI (und davon gibt's viele, wenn man sich andere Engines und die verschiedenen Vorschläge, z.B. Midjourney anschaut) führt da zwangsläufig wieder mitten ins Uncanney Valley.
Auch wenn das nach mimimimi klingt: Das Modell jetzt macht sich momentane Stile in der Fotografie / Film zunutze. Wenn man Identifikation als Maxime näme, ich könnte bei den Personen rechts vielleicht meine Geschwister nicht 100% erkennen, selbst wenn die das wären. Sonnenbrille, Gesichter im Schatten, Hut, Hintergrund (Himmel) heller als Gesicht.... das klingt alles nach Ausreden, aber das sind alles Faktoren die Ai helfen, weil letztendlich Gesichtszüge "kaschiert", Augen nicht sichtbar sind etc.
Da wäre doch letztendlich das Kontrollexperiment interessant:
Studio, simple Beleuchtung, gut sichtbares Gesicht. 6 Fotos insgesamt, davon 5 Menschen und man muss die Ai finden. Oder umgekehrt, 5 Ai-Charaktere und finde den 1 Menschen.
Da fände ich wird es spannend, so ist es beeindruckend, aber letztendlich nicht die Große "Kunst" wenn man sich etwas mit machine Learning auseinandersetzt.
PS: Walter Benjamin würde im Grab mit mehreren Tausend RPM mit Vilem Flusser um die Wette rotieren, wenn die lesen könnten, dass die Bedienung von Ai kreativ ist. Ich streite das nicht ab, da schließt sich der Kreis zu Aura und Technobildern nur - full circle. Das ist die Imagination in der Eingabestufe und die Vollendung des technischen Apparats in der Ausgabestufe. Wie viel Imagination, wie viel Automatik? Das wird auch noch spannend.