Ein Team vom AI Lab von ByteDance, der Muttergesellschaft von TikTok, hat eine neue, auf neuronalen Netzen basierende Methode vorgestellt, um Musikaufnahmen in mehrere einzelne Tonspuren zu zerlegen. Das folgende Beispiel demonstriert eindrücklich, was der neue Algorithmus vermag: er kann ziemlich sauber die Gesangsspur von der musikalischen Begleitung trennen oder auch das Schlagzeug oder den Bass - und die Musik ohne Bass und Schlagzeug anspielen.
Einsetzen läßt sich die Methode für verschiedene Zwecke: natürlich ist sie perfekt zum Remixen von Musik, wenn man nicht über die einzelnen Spuren der Originalaufnahme verfügt - bei Gesangsaufnahmen in Videos könnten so theoretisch auch nachträglich noch die Stimmen in einer anderen Sprache gedubbt werden. Interessant wäre ein Versuch, ob der Algorithmus auch in der Lage ist, Stimmen aus Aufnahmen vor einer Geräuschkulisse zu extrahieren - er ließe sich dann wie ein intelligenter Rauschfilter nutzen, um nachträglich klarere Aufnahmen zu produzieren.
// Top-News auf einen Blick:
- Canon Cinema EOS C50 - Vollformat kompakt mit 7K60p Open Gate RAW Aufzeichnung
- Nikon deaktiviert Authenticity Service für Z6 III
- Preview auf objektbasierte Maskentools in der Premiere Pro Beta
- Blackmagic DaVinci Resolve Studio ab sofort auch mit monatlicher Lizenz
- Revolutionärer AF für Cine-Objektive: Tilta Autofokus-Adapter zapft interne Kamera-...
Wer nicht über die erforderlichen Kenntnisse verfügt, kann den Algorithmus hier mit einem kleinen Audioschnipsel seiner Wahl selbst ausprobieren (als Input wird eine maximal 10 Sekunden lange Sounddatei im .Wav-Format benötigt) - bei unserem Test hat die Trennung in Stimm- und Begleitspur sehr gut funktioniert.

Musik separieren zum selbst ausprobieren