Logo Logo
/// 

Meinung : Midjourney trifft Pika Labs: Generative KI -Videos - Was geht, was kommt?

von Fr, 29.September 2023 | 4 Seiten | diesen Artikel auf einer Seite lesen

 Einleitung
 Bewegung triggert die Aufmerksamkeit
 Sprache kann nicht alles beschreiben

Seitdem man mit generativen KI-Modellen wie Midjourney oder Stable Diffusion fotorealistische Bilder generieren kann, warten KI-Apologeten nun natürlich auch sehnsüchtig darauf, ähnlich imposante, bewegte Ergebnisse zu Gesicht zu bekommen. Doch eine realistische Bewegung für einen animierten Clip "digital zu erträumen" erweist sich für ein KI-Modell noch einmal als deutlich anspruchsvollere Aufgabe, als "nur" ein realistisches Standbild zu erstellen.



Bewegung triggert die Aufmerksamkeit



Das grundsätzliche Problem ist dabei, dass uns Menschen unnatürliche Bewegungen noch viel schneller auffallen, als kleine, fehlerhafte Details in Fotos. Da unser Wahrnehmungssystem besonders stark auf Veränderungen in unserem Blickfeld getrimmt ist und diese von unseren evolutionären Primär-Reflexen (optimiert auf Jagd und Flucht) vorrangig verarbeitet werden, fallen hier kleinste Unstimmigkeiten sofort auf. Und lenken unser Augenmerk ganz besonders auf jede Unstimmigkeit in der Wahrnehmung. Umso erstaunlicher ist es, mit welchen Fortschritten die neuesten KI-Modelle nun auch das Problem einer glaubwürdigen Bewegung angehen.

Ein grundsätzliches Problem bleibt vorerst bestehen; Nachdem man weder den kompletten Bildinhalt noch die notwendigen Bewegungsschritte erschöpfend mit einem Prompt beschreiben kann, muss die KI immer viele offene (weil nicht formulierte) Bereiche des Bildes selbst plausibel "erfinden". Beschreibt man beispielsweise nur: "Drehe den Kopf nach links", so bleibt trotzdem viel notwendige Information unformuliert, und damit undefiniert.



Sprache kann nicht alles beschreiben



Wie soll sich zum Beispiel die Mimik während einer Kopfdrehung verändern? Was soll mit den Haaren passieren? Sollte die Person vielleicht nicht auch ein- oder zweimal blinzeln? Zudem lassen sich viele notwendige Details ohnehin nur schwer mit Sprache ausdrücken. Wie könnte man beispielsweise sinnvoll beschreiben, dass sich ein Hemdkragen bei der Bewegung in einer bestimmten Art und Weise falten soll. Und selbst wenn man hier viele Details formulieren könnte, so müssten diese Formulierungen auch schon in den Trainingsdaten vorgelegen haben - was wohl bislang auch nicht der Fall gewesen sein dürfte.

Bildausschnitt aus Star Wars 2023



Aus Erfahrung einfach spinnen lassen? / Bewegung ohne Ziel / Aktuelle Beispiele


4 Seiten:
Einleitung / Bewegung triggert die Aufmerksamkeit / Sprache kann nicht alles beschreiben
Aus Erfahrung einfach spinnen lassen? / Bewegung ohne Ziel / Aktuelle Beispiele
Viel geht noch etwas daneben, aber einiges klappt! / Kontrolle mit KI-Regieanweisungen / KI mit Stil / Also wann?
  

[noch keine Leserkommentare] [Kommentar schreiben]   

Weitere Artikel:


Meinung: Die IBC 2023 und die KI-Revolution - War da was oder kommt das noch? Mi, 20.September 2023
Die IBC hat gerade wieder ihre Pforten geschlossen - doch von generativer Video KI war noch nichts zu sehen.
Wissen: Künstliche Intelligenz einfach erklärt - Perzeptron, Backpropagation und Loss Fr, 4.August 2023
Generative KI-Modelle wie Midjourney, Runway oder Stable Diffusion werden immer leichter für jedermann zu bedienen. Dennoch verstehen die wenigsten Anwender was hinter den Kulissen vor sich geht. Das versuchen wir mit einfachen Worten zu ändern...
Wissen: Wichtige KI-Begriffe einfach erklärt - Was bedeutet Seed und wofür braucht man das? Di, 11.April 2023
Nein, Generative KI geht ganz sicher nicht mehr weg und darum ist es sicherlich niemals zu früh, sich mit den Basics vertraut zu machen. Wie beispielsweise mit dem sogenannten Seed...
Aktuelles: ControlNet - Die nächste Stufe der KI-Bilderzeugung? Do, 23.Februar 2023
Auch wenn die Ergebnisse mittels KI geschaffener Bilder oft bemerkenswert sind - es lässt sich nicht leugnen, dass momentan die Schöpfer der meisten Werke relativ wenig Einfluss auf das Ergebnis hatten. Doch das dürfte sich schon bald ändern...
Aktuelles: Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher? Mo, 6.Februar 2023
Aktuelles: Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz Di, 3.Januar 2023
Aktuelles: KI macht´s möglich: Fake-Filmstills von Fritz Langs Star Wars, Jodorowskys Tron und mehr Di, 6.Dezember 2022
Aktuelles: Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC Di, 30.August 2022
Meinung: Wer bringt die erste DSLM mit integriertem ND-Fiter? Sony, Canon, Panasonic ...? Di, 10.Oktober 2023
Meinung: Digitale Avatare im Metaverse - doch das nächste große Ding? Di, 3.Oktober 2023
Meinung: Die Zukunft des Tracking - das Ende der High-Speed-Kameras? Di, 27.Juni 2023


[nach oben]


[nach oben]















Artikel-Übersicht



Artikel-Kategorien:



update am 2.Dezember 2023 - 23:03
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*