Newsmeldung von slashCAM:
Das kanadische Startup Lyrebird hat eine Stimmensimulation entwickelt, der nur 1 Minute Originalaufnahme einer Stimme reichen, um diese zu imitieren. Dazu wurde ein neuro...
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Lyrebird: jede Stimme in 60 Sekunden imitieren
Antwort von Pianist:
Eins habe ich jetzt noch nicht verstanden: Tippt man da den entsprechenden Text ein, und die Software spricht dann? Oder wird da eine gemachte Aufnahme eines Menschen so bearbeitet, dass die danach wie die Stimme eines anderen Menschen klingt?
Matthias
Antwort von tom:
Pianist hat geschrieben:
Eins habe ich jetzt noch nicht verstanden: Tippt man da den entsprechenden Text ein, und die Software spricht dann? Oder wird da eine gemachte Aufnahme eines Menschen so bearbeitet, dass die danach wie die Stimme eines anderen Menschen klingt?
Matthias
So wie ich das verstanden habe, wird der Sprechtext rein synthetisiert.
Thomas
Antwort von Pianist:
Ich würde es ja viel interessanter finden, meine eigene Sprachaufnahme so klingen zu lassen wie die eines anderen Sprechers...
Matthias
Antwort von tommyb:
Kannst du ja, brauchst nur ein paar Minuten Ton des anderen Sprechers und dann noch deinen Text in getippter Form.
Es ginge sicher auch eine "Stimmenkonvertierung" in Echtzeit, aber das ist nicht Ziel des Projekts. Speech2Text gibt es ja bereits, dann wäre auch Speech2Text2Speech oder Speech2Speech möglich. Fehlt nur das Programm und ggf. auch die Möglichkeit das in Echtzeit auszugeben. Aktuell dauert ja die Stimme zu Text Konvertierung immer ein paar Sekunden.