Adobe hat auf der Hausmesse Adobe MAX das Project VoCo vorgestellt, eine Software, die - genügend Trainingsmaterial vorausgesetzt -jede beliebige Stimme nachahmen kann. Schon 20 Minuten von Sprechbeispielen sollen reichen, um eine Stimme samt ihrer Sprachcharakteristik einigermaßen gut zu simulieren.
Die Sprachaufnahme wird analysiert, in Phoneme heruntergebrochen und in Text transkribiert. Dann kann dieser wie in einem Texteditor editiert werden. Wörter können geändert, ergänzt oder ausgetauscht werden - das Programm kann diese in der vorher trainierten Stimme dann wieder ausgeben. Hier ein Beispiel aus der offiziellen Vorstellung auf der Adobe MAX:
Für die Audio- und Videobearbeitung wäre es so leicht möglich, nachträglich Sprachaufzeichnungen zu verändern, z.B. um Aussprachefehler zu korrigieren und um sich das erneute Kommen des Sprechers bei neu hinzugekommenen oder verändertem Text zu sparen. Juristisch werden damit auch Fragen um das Recht an der eigenen Stimme aufgeworfen: wem gehören Aufnahmen, die mit der Hilfe von VoCo aus einer fremden Stimme - wie etwa der eines bekannten Schauspielers oder Synchronsprechers - neu erzeugt wurden?
// Top-News auf einen Blick:
- Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes
- Blackmagic Camera for Android 2.1 bringt neue Features
- Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen
- Achtung: Verpixelte Videos können wieder kenntlich gemacht werden
- KI-generierte Fake-Trailer: Wie Hollywood an der Irreführung der Zuschauer ...
- Beleuchtung für Foto und Video lernen mit kostenlosem Tool von Google

VoCo betrifft zwar nur den Ton - aber im Zusammenspiel mit einem Algorithmus, wie dem vor einem Jahr vorgestellten zur Live Manipulation des Gesichts würde eine ganz neue Dimensionen eröffnen. Dieser Algorithmus ermöglicht es, die Gesichtsmimik in einem Video quasi per digitalem Marionettenspiel fernzusteuern - so könnten etwa in der Postproduktion Szenen samt Mimik und O-Ton der Schauspieler auf eine bisher nicht mögliche Weise nachträglich editiert werden. Aber es wären auch beliebige verfälschende Manipulation von Video möglich - jedem könnte nachträglich jede Aussage samt passendem Video untergeschoben werden. Fälschungen von O-Tönen samt Video würden so leicht zu produzieren und (im Zuge der Weiterentwicklung) immer schwerer von der Realität zu unterscheiden. Ebenso könnte durch VoCo der Passwortschutz per Stimmerkennung ausgehebelt werden.
Adobe hat noch nicht bekanntgegeben, ob und in welcher Form VoCo in Adobe Produkte integriert werden wird (wenn, dann mit digitalem Wasserzeichen zur Identifikation), aber in der ein oder anderen Form (von einem anderen Hersteller) wird VoCo oder ein ähnliches Tool wohl früher oder später für jedermann einsetzbar sein - die von Adobevertretern geäußerte Hoffnung, dass die VoCo-Technologie nicht in die falschen Hände geraten dürfe, dürfte sich mittelfristig als naiv erweisen.