Seite 1 von 1

OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 16:45
von slashCAM

Es gibt ja schon seit längerem verschiedene DeepLearning Algorithmen, welche die unterschiedlichsten Stimmen täuschend echt nachahmen können - allerdings war bisher imme...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 17:12
von pillepalle
Ein kurzer Audiosample aus einem Film und ich kann demnächst George Clooney, oder Al Pacino, als Sprecherstimme für mein Youtube-Video nutzen :)

VG

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 18:30
von Drushba
Vielleicht kann mensch das irgendwann auch ganz Profan zur Tonrettung bei Wind und anderen Störgeräuschen einsetzen. :)

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 19:06
von klusterdegenerierung
Wir steuern mit riesen Schritten auf ein Disater zu!

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 19:19
von Drushba
klusterdegenerierung hat geschrieben: Mo 09 Jan, 2023 19:06 Wir steuern mit riesen Schritten auf ein Disater zu!
Da sind wir doch schon drin. Vielleicht steuern wir ja geradewegs wieder raus? Ich sehe den gesamten Bereich KI eher dazu geeignet, überall bestmögliche Lösungen zu finden, Korruption zu bekämpfen, Diplomatie zu erhalten und die Welt ein Stück gerechter zu machen. Wenn das für den Preis von Fakestimmen auf dem AB erkauft wird, mei. :)

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 19:21
von -paleface-
klusterdegenerierung hat geschrieben: Mo 09 Jan, 2023 19:06 Wir steuern mit riesen Schritten auf ein Disater zu!
Sehe ich tatsächlich ähnlich.

Es passiert soviel grad... Das kann irgendwann niemand mehr kontrollieren.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 19:21
von Jott
Drushba hat geschrieben: Mo 09 Jan, 2023 18:30 Vielleicht kann mensch das irgendwann auch ganz Profan zur Tonrettung bei Wind und anderen Störgeräuschen einsetzen. :)
Kann er schon hervorragend. Hatten wir doch neulich erst, scheint sich nicht rumzusprechen.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 19:43
von Jott
Was die Stimmen angeht: ich denke, dass durchschnittlich gute bis schlechte englische Sprecher in einigen Jahren die Verlierer sein dürften.

Wir hatten neulich mal ein Tonstudio in Asien gesucht, um ein paar dortige Sprachfassungen zu übernehmen. Da gibt es tatsächlich schon viele, die primär Produktionen mit künstlichen Stimmen anbieten. Und nicht mal unbedingt billig.

Das ist wohl der Lauf der Dinge. Bedeutet: in Zukunft bleiben nur die wirklich Guten übrig - und verdienen sich eine goldene Nase.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 19:58
von Frank Glencairn
Jott hat geschrieben: Mo 09 Jan, 2023 19:43 Was die Stimmen angeht: ich denke, dass durchschnittlich gute bis schlechte englische Sprecher in einigen Jahren die Verlierer sein dürften.
Nicht nur englische, ich hatte das hier kürzlich auf deutsch.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mo 09 Jan, 2023 21:00
von klusterdegenerierung
Drushba hat geschrieben: Mo 09 Jan, 2023 19:19
klusterdegenerierung hat geschrieben: Mo 09 Jan, 2023 19:06 Wir steuern mit riesen Schritten auf ein Disater zu!
Korruption zu bekämpfen, Diplomatie zu erhalten und die Welt ein Stück gerechter zu machen.
Den Zusammenhang mußt Du mir mal plausibel erklären!

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 02:50
von Blackbox
Soziologie und Philosophie scheinen diesen gegenwärtigen Entwicklungen seit längerem hinterherzuhinken, obwohl eine verstärkte und vertiefende Beschäftigung mit diesen immer weiter reichenden Manipulationen der 'Realität' oder Wirklichkeit im Prozess der medialen Vermittlung dringend Not täte.
'Echt' und Fake noch zu unterscheiden wird in Zukunft wohl erstmal nur sehr viel schwieriger werden, aber im nächsten Schritt vielleicht schon unmöglich werden.
In einigen Jahren werden allenfalls noch die von irgendwelchen Konzernen programmierte KI's auseinanderhalten können, was 'echt' ist und was von den KI-Kollgen des eigenen oder eines anderen Konzerns ausgespuckt wurde ... ?

'Kritische Programmierer' scheinen auch ausgestorben zu sein.
Dazu passend:
Heute ist der 100.Geburtstag von Weizenbaum. Es gibt um 18:00 einen Stream:
https://www.weizenbaum-institut.de/news ... nstaltung/

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 07:52
von Jalue
Erstmal zum Nutzwert: Vor zwei Tagen hatte ich meinen Aha-Effect, als ich mit Hilfe des Online tools "Enhanced Voice" von Adobe (siehe News-Meldung hier bei Slashcam von Ende Dezember) einen völlig kaputten O-Ton retten konnte, Kameramikro, Windgeräusche, ihr wisst schon ... Kurz durch dieses Ding gezogen und schon war die Stimme wieder glockenklar - wobei die KI an absolut unverständlichen Stellen lustigerweise versuchte, fehlende Wortteile eigenständig zu ergänzen, wie es für mich klang auf Englisch, aber mit der Stimme des Protas! Egal, mit Audition o.ä. hätte man das niemals hinbekommen.

Ich finde auffallend, wie viele dieser KI-basierten Tools, gerade in unserer Branche, in den letzten Monaten auf den Markt gekommen sind. Die Frage, die ich mal in die Runde werfen möchte: Was ist da passiert? Gab es 2022 irgendeinen technologischen Durchbruch, eine neue Programmiersprache, whatever? Ihr seht, ich habe keine Ahnung von KI - aber so dürfte es wohl den meisten gehen.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 08:06
von Wingis
Blöd gesagt: Ich glaube, wir haben all die hungrigen KI-Trainingsroutinen die letzten Jahre derart mit virtuellem Futter vollgestopft, dass sie nun einfach anfangen solche Ergebnisse in die Welt hinauszurülpsen.

Diese Ansätze sind ja alle nicht neu und mit wachsender Hardwareleistung und Software-Erfahrung war es nur eine Frage der Zeit, bis sich endlich auch dieser letzte große Menschheitstraum erfüllen lässt und Donald Trump meinen AB bespricht.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 09:30
von Frank Glencairn
Jalue hat geschrieben: Di 10 Jan, 2023 07:52
Ich finde auffallend, wie viele dieser KI-basierten Tools, gerade in unserer Branche, in den letzten Monaten auf den Markt gekommen sind. Die Frage, die ich mal in die Runde werfen möchte: Was ist da passiert? Gab es 2022 irgendeinen technologischen Durchbruch, eine neue Programmiersprache, whatever? Ihr seht, ich habe keine Ahnung von KI - aber so dürfte es wohl den meisten gehen.
Ich glaub das sind nur Variationen, die alle auf der selben Basis aufsetzen - die unterscheiden sich dann hauptsächlich im Trainigsmaterial und verschiedenen Add-ons. Ähnlich wie die verschiedenen Linux Varianten.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 10:54
von Drushba
Blackbox hat geschrieben: Di 10 Jan, 2023 02:50 'Kritische Programmierer' scheinen auch ausgestorben zu sein.
Dazu passend:
Heute ist der 100.Geburtstag von Weizenbaum. Es gibt um 18:00 einen Stream:
https://www.weizenbaum-institut.de/news ... nstaltung/

Ich glaube, es gibt jede Menge kritische Programmierer (zumindest kenn ich das von der hiesigen Uni und deren Vortragsveranstaltungen). Aber was sollte ein "kritischer Programmierer" machen, wenn diverse Konzerne oder Forschungseinrichtingen daran arbeiten? Destruction-Bots in Umlauf bringen?)) Ich finde dass wir - im Gegenteil - auf riesige Chancen zusteuern. Allerdings liegt es tief im deutschen Wesen begraben, allen Fortschritt pessimistisch zu betrachten und am Wochenende eher auf Naturwanderungen und Mittelaltermärkte zu gehen, als Technologie auszuprobieren (und trotzdem kamen viele historische Neuerungen aus Deutschland und ich will nicht wissen, was sich ein Carl Benz von Zeitgenossen anhören musste, die genauso konservativ gestrickt waren wie heute.))).

Das Problem ist doch eher, dass wir am Ende nicht nur technisch, sondern auch mental abgehängt sein werden, wenn wir alles verneinen. Dass Risiken bestehen ist klar, aber mit KIs werden wir in der Lage sein, ziemlich schnell Probleme zu lösen, für die es keine Lösung im bisherigen Bereich gibt. Medizin, Forschung, Konstruktion, Verwaltung, Wirtschaft etc. Und wenn ein Abmahnanwalt merkt, dass er durch eine KI ersetzt werden kann und die Gesetze daraufhin verbessert werden, so dass seine Tätigkeit ohnehin sinnlos wird, dann werden seine Kids eben nicht mehr Anwalt werden, sondern etwas Interessanteres lernen.)) Auch mein Steuerberater ist der Auffassung, dass er bald überflüssig sein wird. Ich mag ihn und wünsch ihm alles Gute für die Rente - aber danach bitte das persönliche Assistenz-Abo einer KI im Preisbereich von Netflix, die mir auch die Steuer macht.))

Audio KIs wären für mich z.B. interessant, um die Audiodeskription für Hörgeschädigte einzusprechen, welche bei jedem geförderten Film fürs Bundesfilmarchiv angefertigt werden muss (wofür das Budget meistens nicht ausreicht und die man daher selbst einsprechen muss - mit denkbar bescheidenem Ergebnis). Und wenn eine KI auf der Grundlage meiner Ideen Drehbücher und rollenspezifische Dialoge im jeweiligen Soziolekt schreibt + probeweise spricht - warum nicht? Erspart mir Monate der Recherche, Fachberater etc. Es wäre dann im Grunde genommen eine weitere Art "Regie" zu führen, ähnlich wie bei einer Schauspielprobe mit Impro. Bislang machen die Versuche damit jedenfalls Spass.))

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 13:47
von cantsin
Jalue hat geschrieben: Di 10 Jan, 2023 07:52 Ich finde auffallend, wie viele dieser KI-basierten Tools, gerade in unserer Branche, in den letzten Monaten auf den Markt gekommen sind. Die Frage, die ich mal in die Runde werfen möchte: Was ist da passiert? Gab es 2022 irgendeinen technologischen Durchbruch, eine neue Programmiersprache, whatever?
Es kamen die großen KI-Datenmodelle wie GPT-3, die mit Investmentmillionen von Elon Musk, Microsoft & Co. entwickelt wurden und auch die Grundlage von KI-Anwendungen wie Dall-E und ChatGPT sind.

Im Prinzip ist das einfach Big Data mit extrem rechenintensivem Maschinenlernen/neuronalen Netzen, für das man entsprechenden Kapitaleinsatz braucht - wobei die Rechner mit einer maximal verfügbaren Anzahl von Daten (wie z.B. Bild-, Text- und Tonarchiven bzw. -Internetmaterial) gefüttert werden, um dieses Material in ihrem Output faktisch zu remixen.

Für GPT-3 waren laut Nachrichtenberichten 1.024 GPUs, 34 Tage, 4,6 Millionen Dollar und 936 Megawattstunden Energie nötig, um das Modell zu trainieren. Und jetzt wird es eben in soviele Anwendungen wie möglich gegossen (von Kundendienst-Chatbots über Bildgeneratoren bis zu Suchmaschinen, Textverbesserungen etc.), damit sich diese Investments auszahlen.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 14:00
von cantsin
Drushba hat geschrieben: Di 10 Jan, 2023 10:54 Dass Risiken bestehen ist klar, aber mit KIs werden wir in der Lage sein, ziemlich schnell Probleme zu lösen, für die es keine Lösung im bisherigen Bereich gibt. Medizin, Forschung, Konstruktion, Verwaltung, Wirtschaft etc. Und wenn ein Abmahnanwalt merkt, dass er durch eine KI ersetzt werden kann und die Gesetze daraufhin verbessert werden, so dass seine Tätigkeit ohnehin sinnlos wird, dann werden seine Kids eben nicht mehr Anwalt werden, sondern etwas Interessanteres lernen.)) Auch mein Steuerberater ist der Auffassung, dass er bald überflüssig sein wird. Ich mag ihn und wünsch ihm alles Gute für die Rente - aber danach bitte das persönliche Assistenz-Abo einer KI im Preisbereich von Netflix, die mir auch die Steuer macht.))
Das heutige KI-Paradigma (Maschinenlernen mit neuronalen Netzen) ist, wie ich weiter oben auch schrieb, im Prinzip ein auf im Daten-/Trainingsmaterial erkannten Korrelationen aufgebautes Remixing. Damit kann man sehr weit kommen und interessante Dinge tun, und auch - wie Du schreibst - uninteressante Aufgaben automatisieren.

Du hast aber gerade bei kreativen Anwendungen das Problem, dass die KI immer das remixt, was sie bereits kennt, auch wenn diese Remixe sehr interessant sein können. Eine KI, die z.B. vor 100 Jahren mit Bildern von damals gängigen Stühlen trainiert worden wäre, hätte niemals einen Bauhaus-Stahlrohrstuhl entwickeln können. Und hätte man sie als Objekterkennungssystem (z.B. in einem Flughafen oder Bürogebäude) eingesetzt, hätte sie den Stahlrohrstuhl als unbekanntes und daher potentiell gefährliches Objekt eingestuft.

Und Du kriegst in Erkennungssystemen oft falsche Kausalitäten, weil Machine Learning eigentlich nur Korrelationen erfasst. Eine Brandsicherungs-machine learning-KI könnte z.B. den Schluss ziehen, dass Eis-essende Kinder im Sommer Waldbrände verursachen, weil es im Überwachungskameramaterial ein Korrelation von Waldbränden und Eis-essenden Kindern gibt. Auf die Idee, dass beides - Eis essen und Waldbrände - durch Hitze verursacht wird, würde das System nicht kommen.

Wegen des Remix-Prinzips und der unüberprüfter Annahmen aus dem Daten-Trainingsmaterial gibt es auch diverse politische Probleme mit Machine Learning-KIs, die die ehemalige Microsoft-Forscherin und heutige NYU-Professorin Kate Crawford als erste untersucht hat. (Ich gehe hier nicht in die Tiefe, um hier im Forum keine ideologischen Glaubenskriege loszuschlagen.) Es gibt von ihr auch gute Vorlesungsmitschnitte auf YouTube.

Was ich von TU-Informatikern gelernt habe: Was wir heute kommerziell und umgangssprachlich "KI" nennen, ist nur ein kleiner (wenn auch sehr erfolgreicher) Teil des Forschungsgebiets Künstliche Intelligenz. Etwa so, als wenn man das Medium Bewegtbild unzurecht auf Kino-Spielfilme reduzieren würde. Die o.g. Probleme sind auch nur spezifisch für diese spezielle Art von (Machine Learning-) KI.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 16:12
von Jalue
cantsin hat geschrieben: Di 10 Jan, 2023 13:47
Jalue hat geschrieben: Di 10 Jan, 2023 07:52 Ich finde auffallend, wie viele dieser KI-basierten Tools, gerade in unserer Branche, in den letzten Monaten auf den Markt gekommen sind. Die Frage, die ich mal in die Runde werfen möchte: Was ist da passiert? Gab es 2022 irgendeinen technologischen Durchbruch, eine neue Programmiersprache, whatever?
Es kamen die großen KI-Datenmodelle wie GPT-3, die mit Investmentmillionen von Elon Musk, Microsoft & Co. entwickelt wurden und auch die Grundlage von KI-Anwendungen wie Dall-E und ChatGPT sind.

Im Prinzip ist das einfach Big Data mit extrem rechenintensivem Maschinenlernen/neuronalen Netzen, für das man entsprechenden Kapitaleinsatz braucht - wobei die Rechner mit einer maximal verfügbaren Anzahl von Daten (wie z.B. Bild-, Text- und Tonarchiven bzw. -Internetmaterial) gefüttert werden, um dieses Material in ihrem Output faktisch zu remixen.

Für GPT-3 waren laut Nachrichtenberichten 1.024 GPUs, 34 Tage, 4,6 Millionen Dollar und 936 Megawattstunden Energie nötig, um das Modell zu trainieren. Und jetzt wird es eben in soviele Anwendungen wie möglich gegossen (von Kundendienst-Chatbots über Bildgeneratoren bis zu Suchmaschinen, Textverbesserungen etc.), damit sich diese Investments auszahlen.
Vielen Dank für die kenntnisreiche Antwort! Ich finde das Thema interessant und werde es demnächst mal einem meiner Kunden vorschlagen, denn die o.g. Frage dürften sich viele stellen. Auch der Aspekt "möglicher Missbrauch", der hier schon angesprochen wurde. ist natürlich hoch spannend, nicht zuletzt: Was wir hier auf Anwender-Ebene sehen, ist vermutlich nur die Spitze des Eisbergs. Ähnliche Entwicklungen in weniger "glamourösen" Branchen laufen vermutlich unter dem Radar der Öffentlichkeit, sind aber für Arbeitnehmer oder Verbraucher ggf. noch folgenschwerer.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 18:20
von Jott
Wichtig ist übrigens nicht das Clooney-Nachmachen für den AB, sondern die Intonation der KI-Stiimen. Die Demos zeigen drei Sekunden echte „lustige Stimme“ oder „traurige Stimme“, und die KI-Stimme spricht dann jeden Text genauso lustig oder traurig.

Das ging bisher so nicht, ich kannte nur etwas lebloses Erklärfilm-Niveau für Anspruchslose.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 19:40
von klusterdegenerierung
Ich muß auf jedenfall die ganze Zeit an den Anruf von letzte Tage bei meinem Vater denken, wo irgendeine Kollone wieder meinte ich hätte eine Frau umgefahren und mein Vater solle schnell Geld überweisen.

Was wenn die die Stimme Deiner Frau clonen und die Dir am Telefon sagt, die haben mich entführt etc. oder plötzlich rufst Du angeblich ständig irgedwo an und sagst schlimme Dinge?

Die Möglichkeiten sind ja grusselig!

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 20:22
von MK
klusterdegenerierung hat geschrieben: Di 10 Jan, 2023 19:40 Was wenn die die Stimme Deiner Frau clonen und die Dir am Telefon sagt, die haben mich entführt etc. oder plötzlich rufst Du angeblich ständig irgedwo an und sagst schlimme Dinge?
Codewort für Notfälle vereinbaren.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 20:40
von Frank Glencairn
Drushba hat geschrieben: Di 10 Jan, 2023 10:54

Ich glaube, es gibt jede Menge kritische Programmierer (zumindest kenn ich das von der hiesigen Uni und deren Vortragsveranstaltungen). Aber was sollte ein "kritischer Programmierer" machen, wenn diverse Konzerne oder Forschungseinrichtingen daran arbeiten? Destruction-Bots in Umlauf bringen?)) Ich finde dass wir - im Gegenteil - auf riesige Chancen zusteuern. Allerdings liegt es tief im deutschen Wesen begraben, allen Fortschritt pessimistisch zu betrachten und am Wochenende eher auf Naturwanderungen und Mittelaltermärkte zu gehen, als Technologie auszuprobieren (und trotzdem kamen viele historische Neuerungen aus Deutschland und ich will nicht wissen, was sich ein Carl Benz von Zeitgenossen anhören musste, die genauso konservativ gestrickt waren wie heute.))).

Das Problem ist doch eher, dass wir am Ende nicht nur technisch, sondern auch mental abgehängt sein werden, wenn wir alles verneinen.
Wir sind ja eher selten einer Meinung, aber hier gebe ich dir völlig Recht.
Bei jeder neuen Technik ist der Deutsche-Reflex erst mal - OMG, das kann missbraucht werden.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 20:54
von Darth Schneider
Dabei missbraucht oder gebraucht wird doch absolut alles was Dollars bringt, sogar schöne Musik…;)))

Gruss Boris

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Di 10 Jan, 2023 21:05
von Darth Schneider
@Kluster
Das diese Technik (und auch andere KI bezogene High End Tools, sehr wahrscheinlich weit fortgeschrittener als wir uns jetzt das bewusst sind, bei den führenden Geheimdiensten und bei Industrie Spionage schon längst im Einsatz sind. Davon können wir wohl alle ausgehen.

Jetzt stell dir mal die endlosen und sehr gefährlichen Möglichkeiten in dem Bereich nur vor…

Von dem her denke ich, dein gruseliges Gefühl dabei ist völlig berechtigt.;)

Aber nicht nur, die Enkel von Isaac Asimov (oder wer war das ?) träumen womöglich diesmal von wirklich (nicht nur) echten K.I. Roboter Schafen…;)))
Gruss Boris

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mi 11 Jan, 2023 20:43
von klusterdegenerierung
Frank Glencairn hat geschrieben: Di 10 Jan, 2023 20:40
Drushba hat geschrieben: Di 10 Jan, 2023 10:54

Ich glaube, es gibt jede Menge kritische Programmierer (zumindest kenn ich das von der hiesigen Uni und deren Vortragsveranstaltungen). Aber was sollte ein "kritischer Programmierer" machen, wenn diverse Konzerne oder Forschungseinrichtingen daran arbeiten? Destruction-Bots in Umlauf bringen?)) Ich finde dass wir - im Gegenteil - auf riesige Chancen zusteuern. Allerdings liegt es tief im deutschen Wesen begraben, allen Fortschritt pessimistisch zu betrachten und am Wochenende eher auf Naturwanderungen und Mittelaltermärkte zu gehen, als Technologie auszuprobieren (und trotzdem kamen viele historische Neuerungen aus Deutschland und ich will nicht wissen, was sich ein Carl Benz von Zeitgenossen anhören musste, die genauso konservativ gestrickt waren wie heute.))).

Das Problem ist doch eher, dass wir am Ende nicht nur technisch, sondern auch mental abgehängt sein werden, wenn wir alles verneinen.
Wir sind ja eher selten einer Meinung, aber hier gebe ich dir völlig Recht.
Bei jeder neuen Technik ist der Deutsche-Reflex erst mal - OMG, das kann missbraucht werden.
Sehe ich anders, als der CD Brenner kam habe ich nicht an den Untergang der Musikindustrie gedacht. :-)

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mi 11 Jan, 2023 22:00
von MK
klusterdegenerierung hat geschrieben: Mi 11 Jan, 2023 20:43 Sehe ich anders, als der CD Brenner kam habe ich nicht an den Untergang der Musikindustrie gedacht. :-)
Da hat ein Rohling auch noch 50 Mark gekostet ;-)

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Mi 11 Jan, 2023 22:21
von Darth Schneider
Früher gab es in der Musik Industrie viel mehr Superstars…
Aber wo sind jetzt die neuen jungen Music Superstars ?

Adele, Billy, Dua Lippa, Taylor Swift….
Viel mehr ist da gar nicht mehr.

Und die Ur alten Stones und der nicht jüngere Elton füllen mit weit über 70 die Konzerthallen immer noch mit Abstand am meisten…

Früher hatte ich für Musik regelmässig wirklich nicht wenig Geld ausgegeben, seit dem Steaming praktisch gar nix mehr…
Geht ja alles über sooo einfach und voll gratis YouTube und Co…
Wie geht diesbezüglich es euch ?;))

Fazit:
Das mit dem Music Streaming war ein Riesen Fehler, oder bisher völlig falsch umgesetzt…
Arme Musiker !!!

Und jetzt kommt die KI…
Gruss Boris

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Sa 14 Jan, 2023 06:02
von Blackbox
Auch in der Musik:
Aldi und Armani.
Die ausgeweitete Menge der 'Mitte' der Musikschaffenden verdient immer weniger, hat kaum noch lukrative Verkaufs- und Auftrittsmöglichkeiten, viele AddOn Jobs fallen weg, während die heutigen Top-'Stars' zugleich sehr viel mehr verdienen als die Top-stars der Schallplatten- und CD-Ära.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Sa 14 Jan, 2023 06:31
von Bluboy
Darth Schneider hat geschrieben: Mi 11 Jan, 2023 22:21 Früher gab es in der Musik Industrie viel mehr Superstars…
Aber wo sind jetzt die neuen jungen Music Superstars ?

Adele, Billy, Dua Lippa, Taylor Swift….
Viel mehr ist da gar nicht mehr.

Und die Ur alten Stones und der nicht jüngere Elton füllen mit weit über 70 die Konzerthallen immer noch mit Abstand am meisten…

Früher hatte ich für Musik regelmässig wirklich nicht wenig Geld ausgegeben, seit dem Steaming praktisch gar nix mehr…
Geht ja alles über sooo einfach und voll gratis YouTube und Co…
Wie geht diesbezüglich es euch ?;))

Fazit:
Das mit dem Music Streaming war ein Riesen Fehler, oder bisher völlig falsch umgesetzt…
Arme Musiker !!!

Und jetzt kommt die KI…
Gruss Boris
RTL bietet 9 Millionen Songs zum streamen, das reicht für mehrere Generaionen

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Sa 14 Jan, 2023 07:34
von Darth Schneider
@bluboy
Nur dumm das ist es halt das die allermeisten Musiker genau deswegen immer ärmer werden.
Es ging mir ja gar nicht um die Anzahl Songs die es gibt.
Klar sind die Songs viel zahlreicher geworden, aber heute kann auch absolut jeder der absolut kein Talent hat, irgend einen Song mit Garage Band selber kreieren und in O Time in die Welt hochladen..

Früher ging das ausschliesslich über ein Label, über einen Musik Produzenten.
Also da man musste noch wirklich vorspielen und wirklich was können..;))))
Gruss Boris

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Sa 14 Jan, 2023 08:23
von Bluboy
Noch garnicht so lange her da war die Rede von, Youtube bietet unbekannten künstlern eine Plattform, eine Chance, ein Sprungbrett
hat sich daran was geändert ?

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Sa 14 Jan, 2023 08:34
von Darth Schneider
Wie viele schaffen den Sprung zum Erfolg vom YouTube Sprungbrett ?
0,001% ?
Ich denke das ist noch sehr optimistisch geschätzt.

Also beim Lotto zu gewinnen oder im Casino zu spielen sind die Chancen zum Erfolg nicht viel kleiner..

YouTube macht vor Allem mit dem Modell, selber Geld ohne Ende !
Gruss Boris

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Sa 14 Jan, 2023 08:39
von Bluboy
Ich stell Dir vor dass Microsoft Ki integriert und bei Eingabe Elvis lebt, der dann tagelang noch nie dagewesene Songs trällert

Einfach Toll, ich freu mich schon.

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Sa 14 Jan, 2023 08:43
von Darth Schneider
@bluboy
So gesehen hast du natürlich recht.
Jede Wette, in 10 bis 20 Jahren können sie Elvis dann einfach so klonen…;))

Aber blöderweise die Supersoldaten und AFD Wähler dann halt ganz einfach auch…
Ups !

Es hat alles immer mindestens 2 Seiten
Gruss Boris

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Verfasst: Sa 11 Feb, 2023 06:41
von soulbrother
Bin gespannt, wann die ersten Betrugsfälle bekannt werden.
Gibt ja z.B. die Gaunerfirmen, die behaupten, man hätte (bei deren Kaltaquiseanruf!) telefonisch ein Abo abgeschloßen, oder dies oder jenes bestellt....
Die können jetzt aus den kurzen Gesprächen komplette "Bestellungen" zaubern...