Logo Logo
/// 

Essays : Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?

von Mo, 6.Februar 2023 | 4 Seiten | diesen Artikel auf einer Seite lesen

 Der Missbrauch ist nicht weit



Der Missbrauch ist nicht weit


Denn User der berüchtigten Internetplattform 4chan haben Elvenlabs Sprach-AI dazu genutzt, Audiofakes mit den Stimmen von bekannten Persönlichkeiten zu produzieren. So zirkulieren unter anderem Clips, in welchen die Schauspielerin Emma Watson einen Auszug aus Adolf Hitlers "Mein Kampf" liest und der amerikanische Präsident Joe Biden ankündigt, Truppen in die Ukraine zu schicken - zum Teil auch noch per DeepFake als Video einigermaßen realistisch animiert.

Hier eine Demo dieser Fähigkeit, Stimmen zu klonen:


Dieser - wenig überraschende - Missbrauch der Technik hat dazu geführt, dass Elvenlabs den bisher anonymen kostenlosen Zugang jetzt beschränkt hat. Zwar gibt es noch die Möglichkeit, kostenlos Sprechersamples zu generieren (mit bis zu 10.000 Zeichen pro Monat), aber User müssen sich davor samt Kreditkarteninformationen registrieren, um nicht mehr ganz so anonym wie bisher zu sein und können nur noch vorgefertigte Stimmen verwenden. Zudem ist die Voice Lab Funktion, mit deren Hilfe beliebige Stimmen nachgeahmt werden können, nurmehr im bezahlpflichtigen Dienst zugänglich. Überlegt wird auch, in Zukunft das Klonen von Stimmen nur noch anhand eines speziellen, extra einzusprechenden Textes zu erlauben, also nicht mehr über x-beliebige Samples.

ElevenLabs versieht ferner jeden Audioclip mit einem Wasserzeichen, um ihn bei Missbrauch zu dem User zurückzuverfolgen, welcher ihn generiert hat und diesen zu sperren. Auch soll demnächst ein Tool veröffentlicht werden, mit dessen Hilfe geprüft werden kann, ob ein Audioclip einer Stimme mit mittels der Elvenlab Technologie erstellt wurde.

Es wird sich zeigen, ob diese Schutzmaßnahmen ausreichen, um Missbrauch zu vermeiden. Allerdings gibt auch noch weitere Sprach-KIs, die sich nicht diese Beschränkungen auferlegen. Es ist also nur eine Frage der Zeit, bis zum nächsten Skandal mit einer Fakestimme.

Individueller gefährlicher sind Stimmfakes aber im privaten Bereich, wo die Möglichkeiten durch die neue Technologie auf noch größtenteils ahnungslose Menschen trifft, welche nicht vorbereitet sind auf täuschend echt gefälschte Stimmen.



Da wenige Sekunden Audiomaterial reichen, um eine Stimme realistisch nachzuahmen (heutzutage leicht in Videos in den sozialen Netzwerken zu finden), könnten AudioFakes bald allgegenwärtig sein, etwa in Form eines Liebesgeständnisses, das jemandem in den Mund gelegt wird, oder Hasstiraden, falschen Aussagen uä. Noch realistischere Enkeltricks mit der Originalstimme oder andere Betrügereien sind ohne viel Phantasie denkbar. Die Stimme hat damit als untrügliches Authentifizierungsmerkmal ausgedient - erst recht im Zusammenspiel mit per ChatGPT (bzw. einer zukünftig noch besseren Text-KI) in Echtzeit erzeugten Dialogtexten.

Virtuelle Stimmen mit menschlichen Emotionen / Echte Stimmen klonen
Was kostet es? Können KIs auch deutsch?


4 Seiten:
Einleitung
Virtuelle Stimmen mit menschlichen Emotionen / Echte Stimmen klonen
Der Missbrauch ist nicht weit
Was kostet es? Können KIs auch deutsch?
  

[6 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
Brave    13:00 am 20.2.2023
Ich kann die deutschen Stimmen von Amazon Polly (Neuralversionen) und - mit noch größerer Auswahl und deutlich mehr Funktionen - von MS Azure direkt empfehlen. Es ist teilweise...weiterlesen
r.p.television    15:10 am 7.2.2023
Ich finde auch die englischen Stimmen nur bedingt zu gebrauchen. Selbst in der Speechelo-Werbung hört sich das sehr plätschernd und einschläfernd an. Sobald man auch nur...weiterlesen
Frank Glencairn    07:56 am 7.2.2023
play.ht, murph, Speechelo und Google. Speechelo geht so halbwegs, aber komischerweise nur die weibliche Stimme, Google scheint mir aktuell das beste zu sein, was deutsche TTS...weiterlesen
[ Alle Kommentare ganz lesen]

Weitere Artikel:


Essays: Zombies am Set: James Dean CGI-Puppe spielt Hauptrolle in neuem Film Mi, 13.November 2019
Schlechte Nachrichten für Schauspieler: die Toten spielen ab jetzt wieder mit - und zwar nicht irgendwelche, sondern die Stars. So soll der legendäre James Dean, 1955 im Alter von nur 24 Jahren gestorben, im Film "Finding Jack" eine der Hauptrollen spielen -- doch was heißt hier "spielen"?
Essays: YouTube: Geld nur noch für 100% werbe-freundliche Videos? Di, 19.September 2017
YouTube hat sich zu einem Medium entwickelt, welches von 100erten Millionen Usern täglich genutzt wird – und das für Viele zu einer Alternative zum Fernsehen geworden ist. Doch wo sind die Grenzen dessen, was gezeigt und an was verdient werden darf? Was passiert, wenn YouTube auf Druck von Werbekunden Videoproduzenten die Möglichkeit verweigert Geld mit ihren Videos zu verdienen?
Essays: Kamera-Trends für 2017 Fr, 7.April 2017
Das Jahr hat ja mit der Panasonic GH5 und der Blackmagic URSA Mini Pro schon aufregend angefangen. Doch was soll denn da eigentlich noch im Rest des Jahres passieren?
Essays: Kühler Kamera-Herbst 2016 Mo, 18.Juli 2016
Nicht weniger als vier relevante Fachmessen gibt es diesen September, jedoch stehen die Zeichen für neue Kameravorstellungen eher schlecht...
Essays: Post NAB 2016: Dynamikumfang, 10-Bit Displays, HDR und Dual Gain Mi, 25.Mai 2016
Essays: Die Non-Gamechanger 2015 - Ein Blick in die Glaskugel Do, 27.November 2014
Essays: Transformers: Spektakel für die Massen oder... Avantgarde? Do, 7.August 2014
Essays: Der Rundumschlag - Sony A7s Mo, 7.April 2014
Essays: Seitenwechsel - Warum nicht 30p? Di, 4.Februar 2014
Essays: Logos und Design - Weniger ist mehr Mo, 22.August 2011
Essays: Ramen R.I.P Di, 2.November 2010
Essays: Das gute Kino Sa, 8.März 2008


[nach oben]


[nach oben]















Artikel-Übersicht



Artikel-Kategorien:



update am 2.April 2023 - 11:36
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*