Adobe Project VoCo: Sprachmanipulation mit dem Texteditor

Adobe hat auf der Hausmesse Adobe MAX das Project VoCo vorgestellt, eine Software, die - genügend Trainingsmaterial vorausgesetzt -jede beliebige Stimme nachahmen kann. Schon 20 Minuten von Sprechbeispielen sollen reichen, um eine Stimme samt ihrer Sprachcharakteristik einigermaßen gut zu simulieren.


Die Sprachaufnahme wird analysiert, in Phoneme heruntergebrochen und in Text transkribiert. Dann kann dieser wie in einem Texteditor editiert werden. Wörter können geändert, ergänzt oder ausgetauscht werden - das Programm kann diese in der vorher trainierten Stimme dann wieder ausgeben. Hier ein Beispiel aus der offiziellen Vorstellung auf der Adobe MAX:




Für die Audio- und Videobearbeitung wäre es so leicht möglich, nachträglich Sprachaufzeichnungen zu verändern, z.B. um Aussprachefehler zu korrigieren und um sich das erneute Kommen des Sprechers bei neu hinzugekommenen oder verändertem Text zu sparen. Juristisch werden damit auch Fragen um das Recht an der eigenen Stimme aufgeworfen: wem gehören Aufnahmen, die mit der Hilfe von VoCo aus einer fremden Stimme - wie etwa der eines bekannten Schauspielers oder Synchronsprechers - neu erzeugt wurden?



Der simple Schnitt von Audiosequenzen samt Neuanordnung von Wörtern ist natürlich jetzt schon möglich, aber VoCo bietet neben einer sehr einfachen Interface (Texteditor) zusätzlich noch die Möglichkeit, völlig neue Wörter relativ nahtlos einzufügen. Adobe will so eine Art Photoshop für Sprachaufnahmen schaffen.


Adobe VoCo Voice-Editing
Adobe VoCo Voice-Editing

VoCo betrifft zwar nur den Ton - aber im Zusammenspiel mit einem Algorithmus, wie dem vor einem Jahr vorgestellten zur Live Manipulation des Gesichts würde eine ganz neue Dimensionen eröffnen. Dieser Algorithmus ermöglicht es, die Gesichtsmimik in einem Video quasi per digitalem Marionettenspiel fernzusteuern - so könnten etwa in der Postproduktion Szenen samt Mimik und O-Ton der Schauspieler auf eine bisher nicht mögliche Weise nachträglich editiert werden. Aber es wären auch beliebige verfälschende Manipulation von Video möglich - jedem könnte nachträglich jede Aussage samt passendem Video untergeschoben werden. Fälschungen von O-Tönen samt Video würden so leicht zu produzieren und (im Zuge der Weiterentwicklung) immer schwerer von der Realität zu unterscheiden. Ebenso könnte durch VoCo der Passwortschutz per Stimmerkennung ausgehebelt werden.



Adobe hat noch nicht bekanntgegeben, ob und in welcher Form VoCo in Adobe Produkte integriert werden wird (wenn, dann mit digitalem Wasserzeichen zur Identifikation), aber in der ein oder anderen Form (von einem anderen Hersteller) wird VoCo oder ein ähnliches Tool wohl früher oder später für jedermann einsetzbar sein - die von Adobevertretern geäußerte Hoffnung, dass die VoCo-Technologie nicht in die falschen Hände geraten dürfe, dürfte sich mittelfristig als naiv erweisen.


Leserkommentare // Neueste
StephanAusBonn  //  15:10 am 7.11.2016
Die Lösung gibt es mittlerweile und mit erstaunlichem gutem Ergebnis: https://www.digitalschnitt.de/shop/artikeldet.php?proid=58654 Ich war sehr erstaunt, weil ich auch...weiterlesen
Pianist  //  12:30 am 7.11.2016
Das ist eine ganz grundsätzliche Frage, mit der man sich auch ganz grundsätzlich auseinandersetzen muss. Die zuständigen Bundesministerien tun das übrigens seit vielen Jahren...weiterlesen
cantsin  //  12:20 am 7.11.2016
Tja, genau hier sind wir in der Grundsatzdebatte über die Anwendung von Artificial Intelligence bzw. deep learning/neuronalen Netzen in der A/V-Technik. Adobe VoCo ist ja nur...weiterlesen
Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash