Die amerikanische Firma Veritone will mit MARVEL.ai eine der ersten kommerziellen KI-Sprecher-Lösungen für den professionellen Einsatz vorgestellt haben. Als End-to-End Voice-as-a-Service (VaaS) sollen ab sofort Medienunternehmen, Marken, Marketeers, Prominente und Influencer hyperrealistische synthetische Stimmen erstellen, verwalten, lizenzieren und monetarisieren können. Veritone MARVEL.ai unterstützt dabei sowohl Text-to-Speech- als auch Speech-to-Speech-Renderings.
Wer sich durch das Buzzword-Bingo der aktuellen Pressemitteilung kämpft erfährt weiter, dass Marvel.ai auch versucht für die komplette Rechteverwertung der lizenzierten Stimme zu sorgen. Sprich eine Art Digital Rights Management auf den charakteristischen Klang einer bei ihnen lizenzierten Stimme durchzusetzen.
Na das klingt doch mal interessant, denn auf diesem Gebiet dürfte es in Zukunft viel zu klären geben. Wie soll man in diesem Zusammenhang beispielsweise mit einem "natürlichen" Stimmenimitator verfahren, der einen Prominenten täuschend echt nachsprechen kann? Dem sind interessanterweise übrigens schon seit Jahrzehnten rechtliche Grenzen gesetzt.

// Top-News auf einen Blick:
- ByteDance Vidi2 produziert selbstständig fertige Videos aus Rohmaterial
- Blackmagic DaVinci Resolve 20.3 bringt Support für 32K-Workflows und mehr
- Bis zu 1.000 Euro sparen: Cashbacks auf Kameras von Sony, Nikon, Canon und Panasonic
- Sony und slashCam verlosen eine FX2 Cinema Line Kamera
- DJI Neo 2: Verbesserte Mini-Drohne für Solo-Creator und Einsteiger
- Blackmagic PYXIS 12K - Sensor-Test - Rolling Shutter und Dynamik
Solche Korrekturen dürften in der Praxis noch häufiger vorkommen, als Veritone es vermuten lässt. Hört man sich die deutschen (und österreichischen) Audio-Demonstrationen der Text-to-Speech-Engine auf der Webseite an, so klingen die meisten Sätze immer noch etwas steif und keineswegs nach emotionaler High-Class Audio-Werbung. Wer beispielsweise eine "Melange" in Wien bewerben wollte, dürfte letztlich mit einer solchen KI-Engine zu gar keinem brauchbaren Ergebnis kommen. Ob es im englischsprachigen Markt besser aussieht, können wir zwar schwer einschätzen, aber wenn man bedenkt, dass Radiowerbung oft von übertriebenen Stimmemotionen geprägt ist, glauben wir, dass hier auch noch ein paar Generationen KI für eine stimmige Klang-Optimierung anstehen.
So gesehen sehen wir vor allem eines: Die KI schreitet stetig voran - auch in der Sprachsynthese. Und trotzdem sind wir noch weit davon entfernt, professionelle Sprecher obsolet zu machen. Die Anwälte stehen dagegen schon heute bereit um die digitalen Felle zu verteilen...



















