Alex
Beiträge: 2077

OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von Alex »

OpenAI kann mittlerweile jede Stimme mit nur 15 Sekunden Input klonen, veröffentlicht das Tool aber (bisher) nicht:
https://openai.com/blog/navigating-the- ... tic-voices

Sehr mächtig und sehr gefährlich.



Frank Glencairn
Beiträge: 26509

Re: OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von Frank Glencairn »

"Mittlerweile" ist relativ, das geht schon seit über nem Jahr mit Coqui, XTTS2, und ein paar anderen.
Sapere aude - de omnibus dubitandum



Alex
Beiträge: 2077

Re: OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von Alex »

Keine Ahnung, wie gut die anderen sind.
"Mittlerweile" deshalb, weil es gerade erst veröffentlicht wurde.
Gestern in nen Bericht im Fernsehen, wirkte das Tool im Vergleich zu anderen nochmal ne Nummer mächtiger und sehr originalgetreu.
Sie geben das Tool ja auch genau aus diesem Grund nicht frei, weil sie Manipulationen (nicht zuletzt zur kommenden Präsidentschaftswahl in den USA) befürchten.



Frank Glencairn
Beiträge: 26509

Re: OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von Frank Glencairn »

Ja, das kommt daher, daß die meisten sich mit AI nur recht oberflächlich auskennen - bestenfalls irgendwelche Webseiten auf denen man das für ne Weile kostenlos testen kann.

Nur wenige machen sich die Mühe verschiedenen Open Source Modelle lokal zu installieren, meistens schon weil die notwendigen Kenntnisse dafür fehlen. Und wenn, dann macht die fehlende Rechenpower nicht genug Spaß um sich intensiv damit zu beschäftigen.

Und ja, der ganze AI-Angst Hype ist natürlich rein von politischen Einzelinteressen geleitet, da hast du völlig Recht. Wobei ich denke, daß das völlig überschätzt wird.
Sapere aude - de omnibus dubitandum



roki100
Beiträge: 18749

Re: OpenAI: Beliebige Stimme klonen mit nur 15 Sekunden Vorlage

Beitrag von roki100 »

Ja die Möglichkeit gibt es schon länger und ich war geschockt als ich 2Pac stimme wieder hörte, nicht nur stimme sondern auch sein Style wie er rappt usw. wirklich verrückt.

"Deine Zeit ist begrenzt. Verschwende sie nicht damit, das Leben eines Anderen zu leben"
(Steve Jobs)



 Aktuelle Beiträge [alle Foren]
 
» Woran arbeitet Adobe? Experimentelle KI-Tools für Video und Audio
von roki100 - Mo 1:48
» Graphite - kostenloser Grafik-Editor von Photoshop bis Motion
von Hayos - So 21:59
» RED erklärt die Umbenennung von NEV-Dateien in R3D
von iasi - So 20:16
» Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?
von roki100 - So 20:12
» Canon PowerShot (G-Serie) ?
von cantsin - So 19:46
» Setup and forget Kamera für Livestream
von trekjk - So 18:55
» Suche Henkelkamera
von Marcodshild - So 16:39
» Blackmagic Pocket Cinema Camera 4K Sensor-Test - Wiedersehen mit ProRes RAW
von Darth Schneider - So 15:14
» Affinity Photo, Designer und Publisher ab sofort in einer kostenlosen App
von vaio - So 12:58
» FireWire ExpressCard TI gesucht!
von dienstag_01 - So 12:17
» RØDE Wireless Microphone Camera Kit - Funkmikro-Set für Kameras
von slashCAM - So 12:02
» Audioequimment für extreme Wetteraufnahmen gesucht
von Jörg - So 9:52
» V-Mount-Akku (IDX Micro 98) tiefentladen
von Blackbox - So 3:50
» Dte Rekorder gesucht
von Marcodshild - Sa 20:32
» Erster Trailer zu Francis Ford Coppolas Megalopolis erschienen
von Jott - Sa 20:17
» Focus Firestore FS-4 Pro HD
von Marcodshild - Sa 15:20
» Kamera bei asgoodasnew kaufen
von Bildlauf - Sa 13:59
» Sony FX3 Nachfolger: Wie wichtig ist Open Gate wenn ein elektronisch verstellbarer ND Filter möglich wäre?
von Mantas - Sa 13:45
» Was hörst Du gerade?
von Nigma1313 - Sa 10:22
» HILFE - Kurzfilm
von -paleface- - Sa 8:29
» HASSLIEBE deutscher Film? Mit Wolfgang M. Schmitt
von 7River - Sa 6:25
» Nach 7 Jahren mit der OG BMPCC finde ich das Bild noch immer schön.
von roki100 - Fr 19:47
» Was schaust Du gerade?
von Darth Schneider - Fr 19:01
» Der deutsche STUNTMAN für Dune, James Bond & Marvel! VI-DAN TRAN
von Darth Schneider - Fr 14:59
» iPhone 17 Pro Max im Praxistest: ProRes RAW, Apple Log 2 - inkl. DJI Osmo Pocket Vergleich
von 123oliver - Fr 9:45
» Adobe Firefly generiert jetzt auch KI-Soundtracks und Voice-Over
von ruessel - Fr 9:29
» Morgen ist heute gestern | Kurzfilm 2025
von Merlin films - Do 20:57
» DJI Neo 2 bringt Rundum-Hinderniserkennung samt LiDAR
von slashCAM - Do 17:42
» Neue Firmware für Sony Alpha 1 II und Sony Alpha 9 III bringt neue Funktionen
von slashCAM - Do 13:33
» 110-Ohm-Mikrofonkabel Wasserdicht bis 20 m
von Blackbox - Do 3:55
» KI: Bessere Sprachverständlichkeit
von freezer - Mi 22:24
» Dumpfe Audiospur als ob sie im Auto laufen würde
von toniwan - Mi 20:10
» Forscher suchen die maximale Pixelauflösung der Augen
von Darth Schneider - Mi 19:17
» Künftige Xbox Next: Vollwertiger Windows-PC mit Potenzial für Videobearbeitung
von Da_Michl - Mi 16:35
» Was hast Du zuletzt gekauft?
von FocusPIT - Mi 12:52