Alex
Beiträge: 2077

OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von Alex »

OpenAI kann mittlerweile jede Stimme mit nur 15 Sekunden Input klonen, veröffentlicht das Tool aber (bisher) nicht:
https://openai.com/blog/navigating-the- ... tic-voices

Sehr mächtig und sehr gefährlich.



Frank Glencairn
Beiträge: 26509

Re: OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von Frank Glencairn »

"Mittlerweile" ist relativ, das geht schon seit über nem Jahr mit Coqui, XTTS2, und ein paar anderen.
Sapere aude - de omnibus dubitandum



Alex
Beiträge: 2077

Re: OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von Alex »

Keine Ahnung, wie gut die anderen sind.
"Mittlerweile" deshalb, weil es gerade erst veröffentlicht wurde.
Gestern in nen Bericht im Fernsehen, wirkte das Tool im Vergleich zu anderen nochmal ne Nummer mächtiger und sehr originalgetreu.
Sie geben das Tool ja auch genau aus diesem Grund nicht frei, weil sie Manipulationen (nicht zuletzt zur kommenden Präsidentschaftswahl in den USA) befürchten.



Frank Glencairn
Beiträge: 26509

Re: OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von Frank Glencairn »

Ja, das kommt daher, daß die meisten sich mit AI nur recht oberflächlich auskennen - bestenfalls irgendwelche Webseiten auf denen man das für ne Weile kostenlos testen kann.

Nur wenige machen sich die Mühe verschiedenen Open Source Modelle lokal zu installieren, meistens schon weil die notwendigen Kenntnisse dafür fehlen. Und wenn, dann macht die fehlende Rechenpower nicht genug Spaß um sich intensiv damit zu beschäftigen.

Und ja, der ganze AI-Angst Hype ist natürlich rein von politischen Einzelinteressen geleitet, da hast du völlig Recht. Wobei ich denke, daß das völlig überschätzt wird.
Sapere aude - de omnibus dubitandum



roki100
Beiträge: 18733

Re: OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von roki100 »

Ja die Möglichkeit gibt es schon länger und ich war geschockt als ich 2Pac stimme wieder hörte, nicht nur stimme sondern auch sein Style wie er rappt usw. wirklich verrückt.

"Deine Zeit ist begrenzt. Verschwende sie nicht damit, das Leben eines Anderen zu leben"
(Steve Jobs)



 Aktuelle Beiträge [alle Foren]
 
» HILFE - Kurzfilm
von Darth Schneider - Fr 20:07
» Nach 7 Jahren mit der OG BMPCC finde ich das Bild noch immer schön.
von roki100 - Fr 19:47
» Was schaust Du gerade?
von Darth Schneider - Fr 19:01
» Was hörst Du gerade?
von roki100 - Fr 18:46
» Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?
von iasi - Fr 17:11
» Blackmagic Pocket Cinema Camera 4K Sensor-Test - Wiedersehen mit ProRes RAW
von roki100 - Fr 17:05
» Sony FX3 Nachfolger: Wie wichtig ist Open Gate wenn ein elektronisch verstellbarer ND Filter möglich wäre?
von Tscheckoff - Fr 16:46
» Woran arbeitet Adobe? Experimentelle KI-Tools für Video und Audio
von Alex - Fr 16:25
» Affinity Photo, Designer und Publisher ab sofort in einer kostenlosen App
von EitschPea - Fr 16:23
» V-Mount-Akku (IDX Micro 98) tiefentladen
von TomStg - Fr 15:37
» Der deutsche STUNTMAN für Dune, James Bond & Marvel! VI-DAN TRAN
von Darth Schneider - Fr 14:59
» iPhone 17 Pro Max im Praxistest: ProRes RAW, Apple Log 2 - inkl. DJI Osmo Pocket Vergleich
von 123oliver - Fr 9:45
» Adobe Firefly generiert jetzt auch KI-Soundtracks und Voice-Over
von ruessel - Fr 9:29
» Canon PowerShot (G-Serie) ?
von beiti - Do 22:40
» Morgen ist heute gestern | Kurzfilm 2025
von Merlin films - Do 20:57
» HASSLIEBE deutscher Film? Mit Wolfgang M. Schmitt
von iasi - Do 20:45
» Kamera bei asgoodasnew kaufen
von Bildlauf - Do 20:16
» DJI Neo 2 bringt Rundum-Hinderniserkennung samt LiDAR
von slashCAM - Do 17:42
» Neue Firmware für Sony Alpha 1 II und Sony Alpha 9 III bringt neue Funktionen
von slashCAM - Do 13:33
» RED erklärt die Umbenennung von NEV-Dateien in R3D
von Jott - Do 6:42
» 110-Ohm-Mikrofonkabel Wasserdicht bis 20 m
von Blackbox - Do 3:55
» Erster Trailer zu Francis Ford Coppolas Megalopolis erschienen
von Funless - Do 0:49
» KI: Bessere Sprachverständlichkeit
von freezer - Mi 22:24
» Dumpfe Audiospur als ob sie im Auto laufen würde
von toniwan - Mi 20:10
» Forscher suchen die maximale Pixelauflösung der Augen
von Darth Schneider - Mi 19:17
» Künftige Xbox Next: Vollwertiger Windows-PC mit Potenzial für Videobearbeitung
von Da_Michl - Mi 16:35
» Was hast Du zuletzt gekauft?
von FocusPIT - Mi 12:52
» Bitte um Rat nach langer, aber verwirrender Recherche
von Jott - Mi 11:47
» SCHLECHTE Regisseure? Mit Wilson Gonzalez Ochsenknecht
von Nigma1313 - Mi 10:42
» >Der LED Licht Thread<
von pillepalle - Mi 1:26
» Canon EOS R6 Mark III Neuvorstellung am 06.11.25
von cantsin - Di 22:00
» slashCam im Gespräch mit Nikon zur neuen ZR und der Zukunft von RED Komodo
von iasi - Di 18:53
» DJI im neuen Gewand: Xtra
von medienonkel - Di 17:13
» Neues Firmware Update 3.0 für die Nikon Zf Kamera
von Funless - Di 14:46
» Insta360 X4 Air vorgestellt - 8K/360° Action-Kamera für 329 Euro
von slashCAM - Di 13:15