Ehrlich gesagt funktionieren einige KI Tools bei z.B. Liedern schon ganz "okayisch" - und extrahieren die einzelnen Stems, sprich Sprache getrennt von den Instrumenten etc... Natürlich nicht immer perfekt je nach Ausgangsmaterial - aber prinzipiell würde ich das gar nicht ganz so "rot" sehen wie Du es es mit dem Klecks darstellst. Denn auch diesen könnte eine Bild-KI entsprechend durch Annäherung der umliegenden Pixel vermutlich halbwegs retuschieren, je nachdem wie groß und wieviel Umfeld noch vorhanden ist. Bei Standbildern klappt das doch auch ziemlich passabel - für Video ist es dann halt deutlich komplexer.
Die Stem-Separation habe ich auch schon erlebt, u.a. ganz aktuell in den Akai MPCs, sehr beeindruckend! Dort dürfte es sehr gelegen kommen, daß Bass, Percussion, Vocals und Melodien meist im selben Frequenzspektrum liegen und entsprechend trainiert werden konnten.rush hat geschrieben: ↑So 14 Jan, 2024 21:26Ehrlich gesagt funktionieren einige KI Tools bei z.B. Liedern schon ganz "okayisch" - und extrahieren die einzelnen Stems, sprich Sprache getrennt von den Instrumenten etc... Natürlich nicht immer perfekt je nach Ausgangsmaterial - aber prinzipiell würde ich das gar nicht ganz so "rot" sehen wie Du es es mit dem Klecks darstellst. Denn auch diesen könnte eine Bild-KI entsprechend durch Annäherung der umliegenden Pixel vermutlich halbwegs retuschieren, je nachdem wie groß und wieviel Umfeld noch vorhanden ist. Bei Standbildern klappt das doch auch ziemlich passabel - für Video ist es dann halt deutlich komplexer.
In der Beta von Resolve 19 ist exakt diese umgekehrte Voice Isolation Funktion die ich mir wünschte nun bereits "out of the box" per Checkbox und Slider verfügbar... Das nur nochmal ergänzend zu Deiner "völlig unmöglich" Aussage von Anfang des Jahres.