Logo Logo
/// News

Synthetische KI-Stimmen machen professionellen Sprechern Konkurrenz

[13:26 So,21.Mai 2023 [e]  von ]    

Generative KIs können mittlerweile Texte erstellen, die wie aus Menschenhand klingen, fotorealistische Bilder aus dem Nichts zaubern und nichtzuletzt - wie schon öfters an dieser Stelle Thema war - menschliche Stimmen glaubhaft synthetisieren. Sowohl Stimmen, die es real gibt, als auch künstliche Neue lassen sich generieren, oder besser gesagt, es lassen sich Aufnahmen mit solchen Stimmen erstellen.

microfon_audiostudio


Anders als etwa die Roboterstimmen, die schon vor Jahren versuchten, uns dubiose Dienste per Telefon zu verkaufen, klingen die jetzt sprechenden Algorithmen uns Menschen tatsächlich zum verwechseln ähnlich. Nicht nur die Aussprache ist quasi perfekt, sie können sogar Emotionen simulieren. Dies wird bereits in betrügerischer Absicht genutzt (etwa bei Enkeltricks oder Erpresseranrufen), doch naheliegend sind natürlich auch viele andere Einsatzzwecke - nämlich praktisch überall, wo bisher Soundaufnahmen von SprecherInnen verwendet wurden. Wir würden tippen, dass wir KI-Stimmen schon häufiger begegnen, als wir denken.



Einem aktuellen Bericht nach beschweren sich beispielseweise Hörbuchsprecher über stark schwindende Aufträge - die Einnahmen sollen sich in manchen Fällen halbiert haben im Vergleich zum Vorjahr. Schuld daran soll hauptsächlich die Konkurrenz durch KI-basierte Vertonungen sein. Es gibt mehrere Dienste im Internet, die anbieten, Hörbücher zum Bruchteil des üblichen Preises zu erstellen. "Gesprochen" werden diese von künstlichen Stimmen mit einem antrainierten Gefühlsregister. In manchen Fällen wurden tatsächliche Sprecherstimmen geklont und ihre Urheber erhalten Lizenzgebühren, wenn ihre Stimme für Aufträge genutzt wird, doch ist dies nicht immer so.

Während traditionelle Sprecher durch KI ihre Lebensgrundlage zu verlieren drohen, werden die neuen Dienste als Demokratisierung der Hörbuchbranche angepriesen. Auch die kleinsten Verlage könnten sich nun Hörbuchversionen leisten, lautet das Argument. Bei deren weitgehend automatisierter Erstellung werden veraussichtlich allerdings nur noch eine handvoll Dienste mitverdienen. Mit einer Kennzeichnungspflicht für KI-basierte Hörbuchproduktionen, wie es manche Sprecher fordern, könnte das Publikum immerhin noch selbst entscheiden, von wem sie sich Geschichten vorlesen lassen.

Ähnlich dürfte es im Synchronisierungsbusiness aussehen. Vorreiter hier scheint Lateinamerika zu sein, zumindest machte im Februar ein Artikel die Runde, der beschreibt, wie dortige Sprecher zunehmend unter Druck geraten durch automatische Dubbing-Dienste, die eben diese Sprecher Stimmsamples für ihr KI-Stimmtraining haben einlesen lassen - zu Dumpingpreisen und ohne weitere Beteiligung.

All diese automatisch generierten KI-Stimmen mögen menschlich klingen und ihre Betonung an den gesprochenen Inhalt anpassen können. Das heißt natürlich nicht, dass sie mit echten (Stimm-)Schauspielern mithalten können. Eine gute Synchronfassung etwa wurde klassischerweise von geschulten Sprechern mit einer richtigen Regie eingesprochen und konnte in manchen Fällen qualitativ mindestens so gut sein, wie das Original (manchmal sogar besser - zumindest lustiger, wie im legendären Fall von Die Zwei).

Heutige Synchronfassungen wirken (im Fernsehen zumal) oft deutlich liebloser, werden in der Regel auch sehr viel billiger und schneller produziert. Es mag in manchen Fällen vielleicht gar keinen so großen Unterschied mehr machen, wenn auf synthetische Stimmen gesetzt wird. Auch lassen sich durch KI ja bekanntlich sogar die Lippenbewegungen im Bild auf den neuen, gesprochenen Text anpassen, sodass es wohl bald möglich wäre, beispielseweise Ryan Gosling als K in Blade Runner seinen Text auf Deutsch abliefern zu lassen, in seiner "eigenen" Stimme.

Gar nicht so uncool, falls dies wirklich gut gelingen sollte. Doch die Aussicht auf einen billigen, KI-generierten Synchro-Gefühlseinheitsbrei allerorten ist weniger erfreulich.


  
[14 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
blindcat    18:13 am 23.5.2023
Sag Bescheid wenn Dir was unterkommt ... :-)
Frank Glencairn    17:55 am 23.5.2023
Ich weiß, hab ich alles schon durch (und wieder gelöscht), war spannend und unterhaltsam, hab allerdings für beides (außer Spieltrieb) keine wirkliche Anwendung - was ich...weiterlesen
blindcat    17:07 am 23.5.2023
Was die Sprecher angeht, wäre es eine gute Idee wenn die Agenturen tätig werden und Modelle ihrer Sprecher erstellen, die schützen lassen und sie dann alternativ zur...weiterlesen
[ Alle Kommentare ganz lesen]

  Vorige News lesen Nächste News lesen 
bildHyliumX: Neue Drohe bleibt mehr als 5 Stunden in der Luft - dank Wasserstoff bildNeue Fuji-X Objektive: Voigtländer Ultron 27mm f2.0 und Tamron 11-20mm F/2.8


verwandte Newsmeldungen:
KI:

AMDs neue Adrenalin Treiber 23.5.1 verdoppeln Rechenleistung in Stable Diffusion 3.Juni 2023
KI-Drohne des US Militärs tötet Operator, um effektiver töten zu können - in Simulation 2.Juni 2023
Japan und Israel mit liberalen Copyright Positionen beim KI-Training 2.Juni 2023
Roll - virtuelles KI-Ministudio für Interviews (iPhone und Web) 1.Juni 2023
Making of - So entstehen die viralen Wes Anderson KI-Videos 29.Mai 2023
Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion 24.Mai 2023
Adobe Generative Fill - KI-Bildergänzung in Photoshop, einfach für jedermann! 23.Mai 2023
alle Newsmeldungen zum Thema KI


[nach oben]

















passende Forenbeiträge zur News:

Archive

2023

Juni - Mai - April - März - Februar - Januar

2022
Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

2005

2004

2003

2002

2001

2000






































update am 4.Juni 2023 - 12:02
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*