Meinung

Stockt die KI-Revolution in der Videoproduktion?

Aktuelle Technologien wie Stable Diffusion lassen eine KI-zentrierte Videoproduktion als bald greifbare Realität erscheinen. Doch bei den großen Softwareherstellern scheint dagegen eher KI-Stillstand zu herrschen...

// 10:41 Di, 7. Mär 2023von Rudi Schmidts

Wenn man die aktuelle Entwicklung der künstlichen Intelligenz aktiv verfolgt, bekommt man mittlerweile in den einschlägigen Reddit Gruppen beinahe täglich neue sensationelle Modelle zu Gesicht - die einen meist neidisch staunend zurücklassen.

Atemberaubende Entwicklungen

"Zurücklassen" im wahrsten Sinne des Wortes, denn wenn man diese Modelle nicht selber mit der Kommandozeile steuern will oder kann, muss man warten, bis sie für jedermann nutzbar gemacht werden. Sei es durch ein Webinterface oder durch die Veröffentlichung als eigenständiges Programm.

Seit kurzem kann man synthetische Charaktere "konsistent" erzeugen.

Doch warum dauert es immer so lange, bis man die sensationellen Beispiele aus einem wissenschaftlichen Paper auch in Premiere, Final Cut Pro oder Resolve benutzen kann? Und das, obwohl Firmen wie Adobe oder Apple bei der KI-Forschung doch in der Regel ganz vorne mitspielen.

Die Sahnehäubchen

Grundsätzlich sieht man in den wissenschaftlichen Aufsätzen (den sogenannten "Papers") immer nur die Sahnehäubchen, denn bei jeder neuen KI-Entwicklung präsentieren die Erfinder in der Regel nur die besonders gelungenen Fälle. Wer selber beispielsweise mit Stable Diffusion bereits erste Schritte gewagt hat, weiß dass die Formulierung eines passenden Prompts Stunden oder sogar Tage beanspruchen kann. Was wir im Netz zu sehen bekommen sind dagegen nur die allerbesten Ergebnisse - nach hunderttausend verworfenen Prompt-Versuchen in der Community.

Wenn Adobe nun aber ein aktuelles Inpainting-Modell implementieren würde, das nur in einem von hundert Fällen ein visuell schlüssiges Ergebnis hervorbringt, wäre diese Funktion für Anwender in der Praxis kaum nutzbar.

Reproduzierbarkeit und Konsistenz

Zudem sollen, bzw. müssen Filter und Effekte reproduzierbar funktionieren. Wenn ein neuer Filter beispielsweise in Resolve Einzug erhält, sollte sich dieser deterministisch (also berechenbar) verhalten - also bei gleichem Input immer das gleiche Ergebnis erzeugen.

Wenn der Filter dagegen bei jedem Aufruf ein anderes Ergebnis ausspuckt, kann man ihn in einer Komposition nicht risikolos einsetzen. Schließlich soll das Bild sich nicht unkontrolliert ändern. Grundsätzlich kann man ein statisches Verhalten auch mit KI-Effekten erzielen (indem man alle Netz-Parameter nicht verändert und nicht mit zufälligen Seeds arbeitet). Aber dann darf der Entwickler die internen Gewichte auch nicht mehr in späteren Programmversionen ändern. Sonst könnte es passieren, dass beispielsweise ein wegradiertes Objekt in einer späteren Version wieder auftaucht - wenn man ein altes Projekt öffnet, das mit einem Filter der Vorversion erstellt wurde.

Aus diesen Gründen übernehmen Firmen wie Adobe, Apple oder Blackmagic nur besonders gründlich ausgetestete KI-Modelle in ihre Programme. Und bis ein Modell mit vielen Motiven hinreichend gut funktioniert, dauert dessen Optimierung in der Regel weitaus länger, als die "wissenschaftlichen Netze" aus den Papers, die meist nur den "Best Case" präsentieren.

Genau solche Probleme machen uns gerade auch die redaktionelle Arbeit mit den heißesten KI-Tools schwer. "Testet doch mal die Filter in Runway!", klingt zwar nach einem interessanten Artikel, ist aber kaum objektiv zu bewerkstelligen. Denn ob und wie gut der Inpainting Algorithmus oder die automatische Objektmaskierung funktionieren, ist extrem stark vom Motiv abhängig. Was mit einer Aufnahme vielleicht problemlos klappt, kann mit einer anderen komplett in die Hose gehen.

Klappt meistens, aber nicht immer zuverlässig: Freistellung in Runway.

Tatsächlich kommt man beispielsweise mit dem Freistellungstools von Runway im Browser oftmals schnell zu brauchbaren Ergebnissen. Aber dann kann es gelegentlich einzelne Frames geben, in denen die Kante sich irrational verhält. Anschließend mit diesen einzelnen Frames zu kämpfen, kostet wieder unverhältnismäßig viel Zeit - wenn man hierfür nicht sogar zu anderen Tools greifen muss.

Schrödingers KI-Filter

Und genau diese nicht hundertprozentige Zuverlässigkeit ist es, die nicht nur selbstfahrende Autos verzögert, sondern auch den produktiven Einsatz in den bekannten Tools verhindert. Es gibt immer noch Fälle, in denen die KI nicht wie vorgesehen reagiert. Und man weiß nicht vorher, ob das eigene Material solche Fälle provoziert, oder nicht. Ob ein KI-Filter wirklich zuverlässig funktioniert, weiß man immer erst, wenn man ihn mit dem eigenen Material ausprobiert hat.

Doch wer nun deswegen desillusioniert in die Video-KI-Zukunft schaut, ist auch auf dem falschen Dampfer. Denn auch wenn man es durch den schleichenden Einzug vielleicht nicht wahrgenommen hat. KI ist bereits da und steht uns bereits ziemlich zuverlässig in zahlreichen Funktionen in diversen kommerziellen Applikationen zur Verfügung.

KI ist schon da

Video AI von Topaz Labs entrauscht, deinterlaced oder skaliert bereits in einer Art, die vor zwei Jahren noch undenkbar war. Color Lab AI übernimmt gerade für Anfänger die Farbabstimmung eines durchgehenden Looks. Adobe bietet schon heute inhaltsabhängige Füllung, einen Rotobrush, eine automatische Szenenerkennung sowie Remix, um Audiotracks nur durch Ziehen in der Länge anzupassen. Und die neuronale Engine in DaVinci Resolve stellt uns Werkzeuge wie die magische Maske, automatische Gesichter-Optimierung oder die Erzeugung synthetischer Z-Puffer via Depth Map bereit.

All die genannten KI-Tools laufen schon heute ziemlich zuverlässig und sind für den täglichen Einsatz "bereit". Und es ist nur eine Frage der Zeit, dass diese noch weiter vereinfacht und optimiert werden.

Gleichzeitig ist die Büchse der Pandora geöffnet und bei allen Unternehmen läuft die Entwicklung und Integration von weiteren, aufregenden KI-Modellen auf Hochtouren. Es braucht einfach nur etwas mehr Zeit, diese auch für die breite Masse an Anwendungsfällen zuverlässig zu optimieren.

Leserkommentare // Neueste

Darth Schneider // 19:47 am 16.3.2023

@Bluboy Intelligente Frage. Der Urheber, zumindest das was die eigentliche Arbeit der KI anbelangt, wird dann auch immer die KI sein. Beziehungsweise halt die Firma die die KI...weiterlesen

Bluboy // 18:29 am 16.3.2023

Wer ist Urheber https://www.derstandard.at/... ... -ki-werkes

Darth Schneider // 08:30 am 16.3.2023

Du kannst dich kaputt lachen oder fürchten, aufdecken wie du willst. Ich denke nicht das das verhindert das die KI Maschine heftig in allen Bereichen ins Rollen kommen wird. Das...weiterlesen

Im Forum mitdiskutieren >>

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Test

KI-Bilder mit Adobe Firefly - einfach, für jeden und besser als Midjourney oder Dall-E2?

Wir hatten bereits die Möglichkeit, Adobes neue KI-Tools namens Firefly auszuprobieren. Wie gut schlägt sich Adobes Einstieg in das Universum der KI-Bildgeneratoren?

// 14:23 Mi, 29. Mär 2023von Rudi Schmidts

Praxis

Mattepainting für Dummys - mit Photoshops Generative Fill Funktion

Wir hatten schon einmal kurz auf Photoshops "Generative Fill"-Möglichkeiten im Zusammenhang mit Videoaufnahmen hingewiesen. In diesem Workshop möchten wir zeigen, wie die ...

// 13:26 Mi, 16. Aug 2023von Rudi Schmidts

Wissen

Grundwissen KI Künstliche Intelligenz einfach erklärt - Perzeptron, Backpropagation und Loss

Generative KI-Modelle wie Midjourney, Runway oder Stable Diffusion werden immer leichter für jedermann zu bedienen. Dennoch verstehen die wenigsten Anwender was hinter den ...

// 12:18 Fr, 4. Aug 2023von Rudi Schmidts

Aktuelles

ControlNet - Die nächste Stufe der KI-Bilderzeugung?

Auch wenn die Ergebnisse mittels KI geschaffener Bilder oft bemerkenswert sind - es lässt sich nicht leugnen, dass momentan die Schöpfer der meisten Werke relativ wenig Einfluss ...

// 17:34 Do, 23. Feb 2023von Rudi Schmidts

Meinung

Midjourney trifft Pika Labs: Generative KI -Videos - Was geht, was kommt?

Seitdem Midjourney oder Stable Diffusion fotorealistische Bilder generieren kann, will man natürlich auch realistische Bewegungen "digital erträumen". Doch das erweist sich für ...

// 10:22 Fr, 29. Sep 2023von Rudi Schmidts

Wissen

Wichtige KI-Begriffe einfach erklärt - Was bedeutet Seed und wofür braucht man das?

Nein, Generative KI geht ganz sicher nicht mehr weg und darum ist es sicherlich niemals zu früh, sich mit den Basics vertraut zu machen. Wie beispielsweise mit dem sogenannten ...

// 09:33 Di, 11. Apr 2023von Rudi Schmidts

zur Artikelübersicht >

Viele Verbesserungen Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes

Kaum drei Wochen nach der Veröffentlichung der Version 20 von Resolve hat Blackmagic schon die zweite Beta seines kostenlosen Grading-, Schnitt-, Compositing- und Audio-Mastering-....

// 12:19 Mi, 23. Apr 2025von Thomas Richter

News

E-Mount Zoom Sony stellt FE 50-150mm F2 GM Zoom für Pros vor: Lichtstark, leicht und hochpreisig

Mit dem FE 50-150mm F2 stellt Sony ein bemerkenswert lichtstarkes Vollformat-Zoom vor, das für professionelle Anwender in den Bereichen Hochzeit, Porträt, Indoor-Sport usw. ...

// 08:00 Mi, 23. Apr 2025von Rob

News

Universeller Speicher Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen

Forscher der Fudan-Universität in Shanghai haben einen neuen Geschwindigkeits-Weltrekord für Flash-Speicher aufgestellt. Der von ihnen in 10-jähriger Arbeit entwickelte "PoX" ...

// 10:05 Di, 22. Apr 2025von Thomas Richter

Ratgeber

Echte Cloud-Alternativen? Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...

Wer die Entwicklung aktueller Video-KI-Modelle verfolgt, sieht fast jeden Tag neue Sensationen. Da liegt es nahe, auch einmal selbst Hand anzulegen, um eigene Erfahrungen mit der ...

// 11:35 Di, 15. Apr 2025von Rudi Schmidts

TOP THEMEN //

MEHR ARTIKEL

zur Artikelübersicht >

PASSENDE DISKUSSIONEN

zum Forum >>

Aktuelle News //

News

Nach 25 Jahren wiederbelebt Günstige RF Kit-Zoomoptik - Canon RF 75-300 mm F4.0-5.6

Canon hat in mehreren Ländern gerade eine RF-Mount-Version seines preisgünstigen Vollformat-Telezoomobjektivs 75-300 mm F4.0-5.6 angekündigt. Das optische Design dieser Optik ist ....

// 14:39 Mi, 30. Apr 2025von Rudi Schmidts

News

Das Ende einer Ära DJI beendet Support für Phantom 4 Pro und Advanced

DJI hat offiziell angekündigt, den Support für die zwei letzten noch unterstützten Drohnenmodelle der legendären Phantom Serie von Quadcoptern einzustellen. Die im Jahr 2016 ...

// 11:27 Mi, 30. Apr 2025von Thomas Richter

zur Newsübersicht >

zum Forum >>

Neueste Artikel //

Aktuelles

Public Voting Nikon Z50II Create-a-Cut Wettbewerb: Stimme für den besten Clip ab!

Unser Wettbewerb mit Nikon geht in die entscheidende Phase: Willkommen zum Public Voting! Zugegeben war die Aufgabe ziemlich anspruchsvoll, doch wir sind schwer beeindruckt, welch ...

// 13:05 Mi, 30. Apr 2025von slashCAM

Zukunft der Postproduktion Adobe auf der NAB 2025: KI für den Videoschnitt mit Premiere Pro und Frame.io

Das komplett neue Color Management in Premiere Pro v25.2, Generative Extend für 4K-Material sowie eine mächtige KI-basierte Suchfunktionen via Media Intelligence and Search - dies ...

// 08:58 Mo, 28. Apr 2025von slashCAM

zur Artikelübersicht >