Ein amerikanisches Startup namens Ponder.ai wirbt damit, der weltweit erste agentenbasierte Video-Editor" zu sein. KI-Unterstützung bei der Videobearbeitung per KI ist g... Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten: Ponder.ai - Agentenbasierter Video-Editor verspricht automatischen Rohschnitt
Welche Gatekeeper meinen die StartUp Tech Clowns eigentlich immer? Den Gate Keeper einen Editor zu bezahlen & lieber alles selber zu machen ohne ein Handwerk zu lernen? Bissl albern oder? Ich hab in der Branche ausser den Aufwand sein Handwerk von der Picke zu lernen nie ienen Gatekeeper kennengelernt… im Gegenteil, fähige junge Leute werden sogar gesucht… weil das Geld nur knapp ist sind die Bezahlungen mies… ob sich das mit Ki tools ändern? never… auwei… Das man mit 0 Referenzen halt schwerer rein kommt ist wohl überall so… und da hilft einen auch kein KI Schnitt weiter. Absolutes Mumpitz gelaber um dern jungen Leuten mit subscribtion Modellen ihre Kohle aus der Tasche zu ziehen… Davinci ist for free und mitn Smartphone kannste drehen, Tutorials gibt es wie Sand am Strand… und in keiner anderen branche wird so sehr auf Zertifikate und Abschlüsse gesch. wie der Film und Medenbranche…
Zuletzt geändert von philr am Sa 23 Mai, 2026 13:05, insgesamt 1-mal geändert.
Phil, die Strategie ist:
- Durch öffentlichen Sprechdurchfall von Sam Altman und Co Angst machen und zugleich FOMO erzeugen
- Dadurch Abos verkaufen
- Die Börse anheizen
- Löhne und Gagen drücken
- Stellenabbau verursachen
- Scheiternde KIs auf die Unfähigkeit der Nutzer schieben
- Idioten (=Influencer) akquirieren und nur Best Cases präsentieren
TBC
Ist sicher ein Blick in die Zukunft. Aus Wackelschrott vom firmeninternen Contentkasper automatisch Gold machen - super! Für TikTok, Insta und YouTube Shorts passt das, wenn‘s klappt.
"Laut Website analysiert das cloudbasierte Tool jeden hochgeladenen Clip und soll Kamerabewegung, Bildkomposition, Motivfokus, Szenentyp, Tempo, emotionale Stimmung sowie Audioqualität erkennen, dann das Material durch strukturierte, durchsuchbare Metadaten ergänzen"
Bis dahin fände ich eine solche "KI" - idealerweise aber lokal bzw. direkt im NLE implementiert - durchaus interessant.
Sprich wenn importiertes Material direkt getaggt, verschlagwortet und analysiert wird so wie man es etwa von DJ Tools kennt - wobei hier oft noch auf entsprechend vorhandene Meta Daten aus dem Netz zugegriffen werden kann - was bei random erstellten Videofiles ja nicht gegeben ist.
Zum automatisierten Schnitt:
Habe das vor etwa 2 Jahren mal in einer Präsentation gesehen... Das NLE erzeugte im Hintergrund Proxys welche dann über eine Bridge/Api an den Cloud Anbieter gingen.
Dann tippte man via Prompt noch einem groben Sprecher-Text ein so wie die Angabe der zu erwartenden Länge (in dem Fall 30s).
Viel mehr ging zu dem Zeitpunkt noch nicht.
Zurück kam nach einigen Minuten eine direkt importierbare Schnittliste respektive befüllte Timeline die technisch funktionierte - viel mehr aber auch nicht.
Das Ergebnis: überschaubar - einerseits waren die Schnitte nicht sonderlich logisch, teils Totale auf Totale und auch wackelige Aufnahmen dabei.
Auch der Zeitaufwand gegenüber einem fähigen Cutter ging diesem Use Case ehrlich gesagt gegen Null - auch weil das ganze dann ja wieder geprüft und optimiert/angepasst werden muss und der Rechenaufwand beim Cloud Anbieter auch Zeit benötigte.
In der Zeit wären die 30s durch einen Cutter jedenfalls auch locker sendefertig montiert gewesen.
Mag natürlich sein das die KI heute nochmals deutlich weiter ist - und es gibt gewiss Projekte wo sowas unterstützend helfen kann.
Die Praxis muss zeigen ob KI's tatsächlich in diesem Sinne kreativ als auch fachlich solide "versteht" wohin die Reise geht.
Last but not least ist Cloud für viele professionelle Anwender/Produktionen aber eben auch eine Red Flag - das Kundenmaterial darf den lokalen Edit Space häufig nicht verlassen was da ganze dann über Cloud Lösungen sowieso ab absurdum führen würde.
Bin gespannt ob und wie tief Resolve sich noch in Richtung KI entwickelt und Fragmente solcher Technologien abbekommt...
Für prep Arbeiten (roto, tracking etc.) wäre KI durchaus interessant, aber leider ist es noch viel zu oft ein Schuss ins Blaue. Man lädt den Krempel hoch (sofern man das darf) und hofft, daß etwas nützliches bei rauskommt... meist klappt es bei offensichtlichen, simplen Aufgaben und man vergeudet danach angesichts dieses Erfolgs so einiges an Zeit mit nutzlosen, Ressourcen vergeudenen Versuchen die komplexen Sachen zu erledigen und muss es dann manuell machen. Habe ich binnen des letzten Monats gleich mehrfach gehabt.
rush hat geschrieben: ↑So 24 Mai, 2026 09:40"Laut Website analysiert das cloudbasierte Tool jeden hochgeladenen Clip und soll Kamerabewegung, Bildkomposition, Motivfokus, Szenentyp, Tempo, emotionale Stimmung sowie Audioqualität erkennen, dann das Material durch strukturierte, durchsuchbare Metadaten ergänzen"
Bis dahin fände ich eine solche "KI" - idealerweise aber lokal bzw. direkt im NLE implementiert - durchaus interessant.
Sprich wenn importiertes Material direkt getaggt, verschlagwortet und analysiert wird so wie man es etwa von DJ Tools kennt - wobei hier oft noch auf entsprechend vorhandene Meta Daten aus dem Netz zugegriffen werden kann - was bei random erstellten Videofiles ja nicht gegeben ist.
Zum automatisierten Schnitt:
Habe das vor etwa 2 Jahren mal in einer Präsentation gesehen... Das NLE erzeugte im Hintergrund Proxys welche dann über eine Bridge/Api an den Cloud Anbieter gingen.
Dann tippte man via Prompt noch einem groben Sprecher-Text ein so wie die Angabe der zu erwartenden Länge (in dem Fall 30s).
Viel mehr ging zu dem Zeitpunkt noch nicht.
Zurück kam nach einigen Minuten eine direkt importierbare Schnittliste respektive befüllte Timeline die technisch funktionierte - viel mehr aber auch nicht.
Das Ergebnis: überschaubar - einerseits waren die Schnitte nicht sonderlich logisch, teils Totale auf Totale und auch wackelige Aufnahmen dabei.
Auch der Zeitaufwand gegenüber einem fähigen Cutter ging diesem Use Case ehrlich gesagt gegen Null - auch weil das ganze dann ja wieder geprüft und optimiert/angepasst werden muss und der Rechenaufwand beim Cloud Anbieter auch Zeit benötigte.
In der Zeit wären die 30s durch einen Cutter jedenfalls auch locker sendefertig montiert gewesen.
Mag natürlich sein das die KI heute nochmals deutlich weiter ist - und es gibt gewiss Projekte wo sowas unterstützend helfen kann.
Die Praxis muss zeigen ob KI's tatsächlich in diesem Sinne kreativ als auch fachlich solide "versteht" wohin die Reise geht.
Last but not least ist Cloud für viele professionelle Anwender/Produktionen aber eben auch eine Red Flag - das Kundenmaterial darf den lokalen Edit Space häufig nicht verlassen was da ganze dann über Cloud Lösungen sowieso ab absurdum führen würde.
Bin gespannt ob und wie tief Resolve sich noch in Richtung KI entwickelt und Fragmente solcher Technologien abbekommt...
Ich bin etwas irritiert, weil genau das geht doch mit DaVinci 21 lokal mit den AI-Tools schon? Es analysiert deine Clips, transcribiert, checkt nach Slates und sortiert das zusammen. AI Slate Detection und IntelliScript klappt eigentlich schon sehr sehr gut.
Etwas aufwendiger kannst dir auch ein Script erstellen (mit Hilfe einer LLM z. B.), das aus dem Rohmaterial automatisiert alle X Sekunden Framegrabs mit Filename und TC rauszieht. Also z. B. alle 5 Sekunden ein Bild, den jeweiligen Timecode und Dateinamen.
Die Bilder kannst du dann durch ne LLM & Bilderkenungs AI analysieren lassen, die dir automatisch Tags erstellt und Tabelle mit TC und Clipnamen ausgibt etc...
Daraus lässt sich dann automatisch ne CSV, Metadata-Liste generieren. Die kannst du wiederum per Script oder API wieder in DaVinci importieren und damit Clips automatisch taggen, sortieren oder in Smart Bins organisieren. Ging so schon vor 21
Zuletzt geändert von philr am So 24 Mai, 2026 11:07, insgesamt 2-mal geändert.
Habe in Resolve ehrlich gesagt nur mit den KI Audiotools gespielt - nicht aber mit Video-basierter KI.
Kann man damit tatsächlich automatisiert und halbwegs sinnvoll Bilder analysieren und verschlagworten lassen?
Also getreu dem Motto: Auto im Bild, rot, Landstraße, Winter... Sodass man später mehrere Takes anhand dieser Schlagworte findet? Ggfs sogar über Projekte hinweg?
Mir geht's weniger um Interviews/Transkribierung als eher um Bild-Content der gern mal untergeht wenn das erste Thumb nicht den gesamten Inhalt visualisiert...
rush hat geschrieben: ↑So 24 Mai, 2026 11:01
Habe in Resolve ehrlich gesagt nur mit den KI Audiotools gespielt - nicht aber mit Video-basierter KI.
Kann man damit tatsächlich automatisiert und halbwegs sinnvoll Bilder analysieren und verschlagworten lassen?
Also getreu dem Motto: Auto im Bild, rot, Landstraße, Winter... Sodass man später mehrere Takes anhand dieser Schlagworte findet? Ggfs sogar über Projekte hinweg?
Mir geht's weniger um Interviews/Transkribierung als eher um Bild-Content der gern mal untergeht wenn das erste Thumb nicht den gesamten Inhalt visualisiert...
Wenn's schon geht - umso besser ;-)
is schon was länger halt auch über kleine umwege möglich…
Davinci hat ne sehr nette Python api die viele prof. cutter & postassistenten eigtl schon länger nutzen… schreib dir n export script für die frames die analisiert werden sollen und kleine Auflösung reicht dafür meist aus 640x irgendwas… alle 5-10sek…jeh nahc dem du kennst das Material ja slebst am besten um ne idee zu bekommen wo es sind macht… jag die durch ne Bilderkennungs ai, token sparend auf deinem rechner, VLM Llama 3.2 Vision oder Llava (bitte die 13B)… Qwen 3.6 Vision geht auch… huggingface ist dein Freund…
Dann lass das LLM dir nen reimport script für dainvi scrieben mit den Infos für den mediapool…
Thats it… und theoretisch… kann man so auch schon länger eine "KI" den ganzen Rohschnitt machen lassen btw… das da oben das produkt is mal wieder nur nen LLM wrapper der nix anderes macht in eigener UI & Software verpackt… kommt am ende der selbe slop raus, weil richtig gut und keativ ist die ki eben nie und wird sie auch so schnell nicht… Schauschau Zauber Zauber HokusPokus Abzockerkuss weil an blöden und lernfaulen verdient man besser als an "Gatekeepern"…
However… in davinci läuft das mit deren internen KI tools aber auch schon länger super...
Und wenn du etwas sehr "spezielles" gefilmt hast und es sich zeitlich lohnt ein eigenes Vision modell zu trainieren OBB/Yolo auf obrigen Weg versuchst kannst du dir auch die Mühe machen die relevanten Objekte in ein paar Clips erstmal selbst zu makieren und dann für den Rest oder folge Serien automatisch labeln zu lassen falls es die normalen modelle nicht kennen. Vll. kommt das ja auch irgendwann mal "intern" in Davinci… weil mit Gesichter und Stimmen klappt das schon
PS! Da dies dann auch größtenteils auf deine eigenen lokalen Hardware-Ressourcen zurückgreift und du nur das KI nur für deine eigenen Zwecke trainierst, ist das ein vollständig ethisch angemessener Umgang mit der Technologie. Geht schon seit neeer Weile btw…
Ein vortrainiertes Modell zum verstehen wie es funktioniert kannst du dir auch auf das Smartphone laden https://apps.apple.com/us/app/ultralyti ... 1452689527 (Kann auch Bewegungen tracken, erkennen etc.
Probiers mal aus… und du kannst deine eigenen Trainingsdatasets ausprobieren). Ich halte es für sehr klug & hilfreich um "Ki" Modelle wirklich auch zu verstehen mal ein eigenes kleines System zu trainieren anstatt jeden BigTech Marketingquatsch zu vertrauen/glauben…etc. wo hunderte Hilfsarbeiter in präkären Arbeitsbedingungen auf fraglich beschafften Trainingsmaterial nämlich genau das für wenige Cent aus dem Investoren & wenigen Subscribtiongeldern tun…
Zuletzt geändert von philr am So 24 Mai, 2026 18:11, insgesamt 1-mal geändert.
Da ist ja ganz schön Marketingwind dahinter.)) Habe versucht, das Video fertig anzuschauen, aber es ging beim besten Willen nicht...
Ich glaube eh, dass das Thema "spezielle Ki für spezielle Anwendungen" mittelfristig gegessen sein wird. Claude, ChatGPT und Google werden das im Vorbeigehen per API erledigen und die Kreativen gleich mit. ;-)
Das sind doch alles youtuber-probleme, weil heutzutage kaum noch jemand handwerklich ordentlich arbeitet. Drehverhältnis und so!
Der schnellste Weg war und wird immer sein Entscheidungen vor und während des Drehs zu treffen. Dann hat man auch keine 1000 clips am tag, die man durch irgendwelche KIs jagen muss um die eigene Unfähigkeit zu kaschieren. Deswegen sparen diese „Filmemacher“ auch angeblich soviel Zeit 😅
btw.: Die meisten unserer spots sind praktisch kurz nach drehschluss fertig.
Rick SSon hat geschrieben: ↑So 24 Mai, 2026 21:28
Das sind doch alles youtuber-probleme, weil heutzutage kaum noch jemand handwerklich ordentlich arbeitet. Drehverhältnis und so!
Der schnellste Weg war und wird immer sein Entscheidungen vor und während des Drehs zu treffen. Dann hat man auch keine 1000 clips am tag, die man durch irgendwelche KIs jagen muss um die eigene Unfähigkeit zu kaschieren. Deswegen sparen diese „Filmemacher“ auch angeblich soviel Zeit 😅
btw.: Die meisten unserer spots sind praktisch kurz nach drehschluss fertig.
Naja Spots…und szenisches arbeiten mit Buch, Auflösung & Board ist ja auch eher pipikaks für nen guten Schnitt… aber dreh mal ne Doku oder Dokuserie insb fürs TV & Streamer die x verschiedene Fassungen und Varianten wollen von X x 23min, 53min, 90min Festival Variante etc…mit Archivmaterial und mehreren Teams… wo die Distributuon und Redaktion ständig noch mit ersetze das gegen was hast du da etc kommt… das sind alles Probleme die haben Youtuber kaum… und wir sprechen nochmal ;-)
Rechtliche Notiz: Wir übernehmen keine Verantwortung für den Inhalt der Beiträge
und behalten uns das Recht vor, Beiträge mit rechtswidrigem oder anstößigem Inhalt zu löschen.