Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum Audio: Software / Bearbeitung / Musikproduktion-Forum

Infoseite // OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage



Frage von Alex:


OpenAI kann mittlerweile jede Stimme mit nur 15 Sekunden Input klonen, veröffentlicht das Tool aber (bisher) nicht:
https://openai.com/blog/navigating-the- ... tic-voices

Sehr mächtig und sehr gefährlich.

Space


Antwort von Frank Glencairn:

"Mittlerweile" ist relativ, das geht schon seit über nem Jahr mit Coqui, XTTS2, und ein paar anderen.

Space


Antwort von Alex:

Keine Ahnung, wie gut die anderen sind.
"Mittlerweile" deshalb, weil es gerade erst veröffentlicht wurde.
Gestern in nen Bericht im Fernsehen, wirkte das Tool im Vergleich zu anderen nochmal ne Nummer mächtiger und sehr originalgetreu.
Sie geben das Tool ja auch genau aus diesem Grund nicht frei, weil sie Manipulationen (nicht zuletzt zur kommenden Präsidentschaftswahl in den USA) befürchten.

Space


Antwort von Frank Glencairn:

Ja, das kommt daher, daß die meisten sich mit AI nur recht oberflächlich auskennen - bestenfalls irgendwelche Webseiten auf denen man das für ne Weile kostenlos testen kann.

Nur wenige machen sich die Mühe verschiedenen Open Source Modelle lokal zu installieren, meistens schon weil die notwendigen Kenntnisse dafür fehlen. Und wenn, dann macht die fehlende Rechenpower nicht genug Spaß um sich intensiv damit zu beschäftigen.

Und ja, der ganze AI-Angst Hype ist natürlich rein von politischen Einzelinteressen geleitet, da hast du völlig Recht. Wobei ich denke, daß das völlig überschätzt wird.

Space


Antwort von roki100:

Ja die Möglichkeit gibt es schon länger und ich war geschockt als ich 2Pac stimme wieder hörte, nicht nur stimme sondern auch sein Style wie er rappt usw. wirklich verrückt.

https://youtu.be/BaHAb8xThlE?t=892

Space


Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum Audio: Software / Bearbeitung / Musikproduktion-Forum

Antworten zu ähnlichen Fragen //


OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample
DreamFusion: Neue Google KI generiert beliebige 3D Modelle - nur per Textbeschreibung
Microsoft VALL-E 2: KI ahmt jede Stimme perfekt nach - nur per 3s Stimmsample
Pro Bild nur 15 Sekunden: Stable Diffusion läuft auf Smartphone
Google optimiert Stable Diffusion für Smartphones: Ein Bild in nur 12 Sekunden
Suche Vorlage für Einverständniserklärung / Rechteabtretung für Film
Premiere Pro CS (Kaufversion) Vorlage auf viele nicht zusammenhängende Clips zuweisen
Nvidia Magic3D - beliebige 3D-Objekte durch Textbeschreibung erzeugen
Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach Textbeschreibung
Neue Audio KI generiert neben Musik auch beliebige Soundeffekte
OpenAI Sora - KI-Videos werden tatsächlich nutzbar...
Vidu - die chinesische Antwort auf OpenAI Sora?
Scarlett Johansson kritisiert OpenAI: ChatGPT spricht wie ich
Noch mehr Konkurrenz für OpenAI Sora: KI-Videogenerator Luma Dream Machine
Stimme/Musik-Trennung mit OpenVINO in Audacity




slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash