Professionelle KI-Sprecher für Jedermann? MARVEL.ai

// 10:24 Do, 27. Mai 2021von

Die amerikanische Firma Veritone will mit MARVEL.ai eine der ersten kommerziellen KI-Sprecher-Lösungen für den professionellen Einsatz vorgestellt haben. Als End-to-End Voice-as-a-Service (VaaS) sollen ab sofort Medienunternehmen, Marken, Marketeers, Prominente und Influencer hyperrealistische synthetische Stimmen erstellen, verwalten, lizenzieren und monetarisieren können. Veritone MARVEL.ai unterstützt dabei sowohl Text-to-Speech- als auch Speech-to-Speech-Renderings.


Wer sich durch das Buzzword-Bingo der aktuellen Pressemitteilung kämpft erfährt weiter, dass Marvel.ai auch versucht für die komplette Rechteverwertung der lizenzierten Stimme zu sorgen. Sprich eine Art Digital Rights Management auf den charakteristischen Klang einer bei ihnen lizenzierten Stimme durchzusetzen.



Na das klingt doch mal interessant, denn auf diesem Gebiet dürfte es in Zukunft viel zu klären geben. Wie soll man in diesem Zusammenhang beispielsweise mit einem "natürlichen" Stimmenimitator verfahren, der einen Prominenten täuschend echt nachsprechen kann? Dem sind interessanterweise übrigens schon seit Jahrzehnten rechtliche Grenzen gesetzt.





Und muss ein KI-simulierter Promi im Gegenzug dann über MARVEL.ai seine inhaltliche Zustimmung zu jedem gerenderten Textschnipsel geben? Dann wären nämlich die Geschwindigkeitsvorteile der synthetischen Produktion wieder schnell dahin, sobald man kurzfristig noch etwas an einem Text feilen will.



Solche Korrekturen dürften in der Praxis noch häufiger vorkommen, als Veritone es vermuten lässt. Hört man sich die deutschen (und österreichischen) Audio-Demonstrationen der Text-to-Speech-Engine auf der Webseite an, so klingen die meisten Sätze immer noch etwas steif und keineswegs nach emotionaler High-Class Audio-Werbung. Wer beispielsweise eine "Melange" in Wien bewerben wollte, dürfte letztlich mit einer solchen KI-Engine zu gar keinem brauchbaren Ergebnis kommen. Ob es im englischsprachigen Markt besser aussieht, können wir zwar schwer einschätzen, aber wenn man bedenkt, dass Radiowerbung oft von übertriebenen Stimmemotionen geprägt ist, glauben wir, dass hier auch noch ein paar Generationen KI für eine stimmige Klang-Optimierung anstehen.



So gesehen sehen wir vor allem eines: Die KI schreitet stetig voran - auch in der Sprachsynthese. Und trotzdem sind wir noch weit davon entfernt, professionelle Sprecher obsolet zu machen. Die Anwälte stehen dagegen schon heute bereit um die digitalen Felle zu verteilen...



Leserkommentare // Neueste
Jalue  //  23:46 am 27.5.2021
In der Breite sicher und es tut mir wirklich leid für gute SprecherInnen - oft sympathische Menschen mit einer soliden Schauspielausbildung, die mit Sprecherjobs die miese...weiterlesen
Frank Glencairn  //  19:44 am 27.5.2021
Noch - trotzdem denke ich daß die Luft für echte Sprecher mittelfristig echt dünn wird. Die Entwicklung geht gerade extrem schnell voran, lange geht das nicht mehr gut. In...weiterlesen
Jalue  //  19:39 am 27.5.2021
Korrekt und manchmal sind diese Lösungen sogar sehr nützlich. So kann man z.B. 1. Schnittfassungen wunderbar mit Roboterstimmen von Diensten wie ttsMP3 vertonen. "Echte"...weiterlesen
Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash