KI Forum



OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample



Alles rund um KIs (DeepLearning), Algorithmen für spezielle Effekte, zur Generierung von Bildern und Videos und mehr
Antworten
slashCAM
Administrator
Administrator
Beiträge: 11262

OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von slashCAM »


Es gibt ja schon seit längerem verschiedene DeepLearning Algorithmen, welche die unterschiedlichsten Stimmen täuschend echt nachahmen können - allerdings war bisher imme...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample



pillepalle
Beiträge: 8573

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von pillepalle »

Ein kurzer Audiosample aus einem Film und ich kann demnächst George Clooney, oder Al Pacino, als Sprecherstimme für mein Youtube-Video nutzen :)

VG
Meine Lieblingsfilme:
Es war ein Mahl in Amerika
Molkerei auf der Bounty
Dune - Der Würstchenplanet



Drushba
Beiträge: 2513

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Drushba »

Vielleicht kann mensch das irgendwann auch ganz Profan zur Tonrettung bei Wind und anderen Störgeräuschen einsetzen. :)
Lieber glaub ich Wissenschaftlern, die sich mal irren, als Irren, die glauben, sie seien Wissenschaftler.



klusterdegenerierung
Beiträge: 27425

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von klusterdegenerierung »

Wir steuern mit riesen Schritten auf ein Disater zu!
"Was von Natur aus flach ist, bläht sich auf!"



Drushba
Beiträge: 2513

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Drushba »

klusterdegenerierung hat geschrieben: Mo 09 Jan, 2023 19:06 Wir steuern mit riesen Schritten auf ein Disater zu!
Da sind wir doch schon drin. Vielleicht steuern wir ja geradewegs wieder raus? Ich sehe den gesamten Bereich KI eher dazu geeignet, überall bestmögliche Lösungen zu finden, Korruption zu bekämpfen, Diplomatie zu erhalten und die Welt ein Stück gerechter zu machen. Wenn das für den Preis von Fakestimmen auf dem AB erkauft wird, mei. :)
Lieber glaub ich Wissenschaftlern, die sich mal irren, als Irren, die glauben, sie seien Wissenschaftler.



-paleface-
Beiträge: 4458

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von -paleface- »

klusterdegenerierung hat geschrieben: Mo 09 Jan, 2023 19:06 Wir steuern mit riesen Schritten auf ein Disater zu!
Sehe ich tatsächlich ähnlich.

Es passiert soviel grad... Das kann irgendwann niemand mehr kontrollieren.
www.mse-film.de | Kurzfilme & Videoclips

www.daszeichen.de | Filmproduktion & Postproduktion



Jott
Beiträge: 21815

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Jott »

Drushba hat geschrieben: Mo 09 Jan, 2023 18:30 Vielleicht kann mensch das irgendwann auch ganz Profan zur Tonrettung bei Wind und anderen Störgeräuschen einsetzen. :)
Kann er schon hervorragend. Hatten wir doch neulich erst, scheint sich nicht rumzusprechen.



Jott
Beiträge: 21815

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Jott »

Was die Stimmen angeht: ich denke, dass durchschnittlich gute bis schlechte englische Sprecher in einigen Jahren die Verlierer sein dürften.

Wir hatten neulich mal ein Tonstudio in Asien gesucht, um ein paar dortige Sprachfassungen zu übernehmen. Da gibt es tatsächlich schon viele, die primär Produktionen mit künstlichen Stimmen anbieten. Und nicht mal unbedingt billig.

Das ist wohl der Lauf der Dinge. Bedeutet: in Zukunft bleiben nur die wirklich Guten übrig - und verdienen sich eine goldene Nase.



Frank Glencairn
Beiträge: 23167

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Frank Glencairn »

Jott hat geschrieben: Mo 09 Jan, 2023 19:43 Was die Stimmen angeht: ich denke, dass durchschnittlich gute bis schlechte englische Sprecher in einigen Jahren die Verlierer sein dürften.
Nicht nur englische, ich hatte das hier kürzlich auf deutsch.
Sapere aude - de omnibus dubitandum



klusterdegenerierung
Beiträge: 27425

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von klusterdegenerierung »

Drushba hat geschrieben: Mo 09 Jan, 2023 19:19
klusterdegenerierung hat geschrieben: Mo 09 Jan, 2023 19:06 Wir steuern mit riesen Schritten auf ein Disater zu!
Korruption zu bekämpfen, Diplomatie zu erhalten und die Welt ein Stück gerechter zu machen.
Den Zusammenhang mußt Du mir mal plausibel erklären!
"Was von Natur aus flach ist, bläht sich auf!"



Blackbox
Beiträge: 448

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Blackbox »

Soziologie und Philosophie scheinen diesen gegenwärtigen Entwicklungen seit längerem hinterherzuhinken, obwohl eine verstärkte und vertiefende Beschäftigung mit diesen immer weiter reichenden Manipulationen der 'Realität' oder Wirklichkeit im Prozess der medialen Vermittlung dringend Not täte.
'Echt' und Fake noch zu unterscheiden wird in Zukunft wohl erstmal nur sehr viel schwieriger werden, aber im nächsten Schritt vielleicht schon unmöglich werden.
In einigen Jahren werden allenfalls noch die von irgendwelchen Konzernen programmierte KI's auseinanderhalten können, was 'echt' ist und was von den KI-Kollgen des eigenen oder eines anderen Konzerns ausgespuckt wurde ... ?

'Kritische Programmierer' scheinen auch ausgestorben zu sein.
Dazu passend:
Heute ist der 100.Geburtstag von Weizenbaum. Es gibt um 18:00 einen Stream:
https://www.weizenbaum-institut.de/news ... nstaltung/



Jalue
Beiträge: 1425

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Jalue »

Erstmal zum Nutzwert: Vor zwei Tagen hatte ich meinen Aha-Effect, als ich mit Hilfe des Online tools "Enhanced Voice" von Adobe (siehe News-Meldung hier bei Slashcam von Ende Dezember) einen völlig kaputten O-Ton retten konnte, Kameramikro, Windgeräusche, ihr wisst schon ... Kurz durch dieses Ding gezogen und schon war die Stimme wieder glockenklar - wobei die KI an absolut unverständlichen Stellen lustigerweise versuchte, fehlende Wortteile eigenständig zu ergänzen, wie es für mich klang auf Englisch, aber mit der Stimme des Protas! Egal, mit Audition o.ä. hätte man das niemals hinbekommen.

Ich finde auffallend, wie viele dieser KI-basierten Tools, gerade in unserer Branche, in den letzten Monaten auf den Markt gekommen sind. Die Frage, die ich mal in die Runde werfen möchte: Was ist da passiert? Gab es 2022 irgendeinen technologischen Durchbruch, eine neue Programmiersprache, whatever? Ihr seht, ich habe keine Ahnung von KI - aber so dürfte es wohl den meisten gehen.



Wingis
Beiträge: 100

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Wingis »

Blöd gesagt: Ich glaube, wir haben all die hungrigen KI-Trainingsroutinen die letzten Jahre derart mit virtuellem Futter vollgestopft, dass sie nun einfach anfangen solche Ergebnisse in die Welt hinauszurülpsen.

Diese Ansätze sind ja alle nicht neu und mit wachsender Hardwareleistung und Software-Erfahrung war es nur eine Frage der Zeit, bis sich endlich auch dieser letzte große Menschheitstraum erfüllen lässt und Donald Trump meinen AB bespricht.



Frank Glencairn
Beiträge: 23167

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Frank Glencairn »

Jalue hat geschrieben: Di 10 Jan, 2023 07:52
Ich finde auffallend, wie viele dieser KI-basierten Tools, gerade in unserer Branche, in den letzten Monaten auf den Markt gekommen sind. Die Frage, die ich mal in die Runde werfen möchte: Was ist da passiert? Gab es 2022 irgendeinen technologischen Durchbruch, eine neue Programmiersprache, whatever? Ihr seht, ich habe keine Ahnung von KI - aber so dürfte es wohl den meisten gehen.
Ich glaub das sind nur Variationen, die alle auf der selben Basis aufsetzen - die unterscheiden sich dann hauptsächlich im Trainigsmaterial und verschiedenen Add-ons. Ähnlich wie die verschiedenen Linux Varianten.
Sapere aude - de omnibus dubitandum



Drushba
Beiträge: 2513

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Drushba »

Blackbox hat geschrieben: Di 10 Jan, 2023 02:50 'Kritische Programmierer' scheinen auch ausgestorben zu sein.
Dazu passend:
Heute ist der 100.Geburtstag von Weizenbaum. Es gibt um 18:00 einen Stream:
https://www.weizenbaum-institut.de/news ... nstaltung/

Ich glaube, es gibt jede Menge kritische Programmierer (zumindest kenn ich das von der hiesigen Uni und deren Vortragsveranstaltungen). Aber was sollte ein "kritischer Programmierer" machen, wenn diverse Konzerne oder Forschungseinrichtingen daran arbeiten? Destruction-Bots in Umlauf bringen?)) Ich finde dass wir - im Gegenteil - auf riesige Chancen zusteuern. Allerdings liegt es tief im deutschen Wesen begraben, allen Fortschritt pessimistisch zu betrachten und am Wochenende eher auf Naturwanderungen und Mittelaltermärkte zu gehen, als Technologie auszuprobieren (und trotzdem kamen viele historische Neuerungen aus Deutschland und ich will nicht wissen, was sich ein Carl Benz von Zeitgenossen anhören musste, die genauso konservativ gestrickt waren wie heute.))).

Das Problem ist doch eher, dass wir am Ende nicht nur technisch, sondern auch mental abgehängt sein werden, wenn wir alles verneinen. Dass Risiken bestehen ist klar, aber mit KIs werden wir in der Lage sein, ziemlich schnell Probleme zu lösen, für die es keine Lösung im bisherigen Bereich gibt. Medizin, Forschung, Konstruktion, Verwaltung, Wirtschaft etc. Und wenn ein Abmahnanwalt merkt, dass er durch eine KI ersetzt werden kann und die Gesetze daraufhin verbessert werden, so dass seine Tätigkeit ohnehin sinnlos wird, dann werden seine Kids eben nicht mehr Anwalt werden, sondern etwas Interessanteres lernen.)) Auch mein Steuerberater ist der Auffassung, dass er bald überflüssig sein wird. Ich mag ihn und wünsch ihm alles Gute für die Rente - aber danach bitte das persönliche Assistenz-Abo einer KI im Preisbereich von Netflix, die mir auch die Steuer macht.))

Audio KIs wären für mich z.B. interessant, um die Audiodeskription für Hörgeschädigte einzusprechen, welche bei jedem geförderten Film fürs Bundesfilmarchiv angefertigt werden muss (wofür das Budget meistens nicht ausreicht und die man daher selbst einsprechen muss - mit denkbar bescheidenem Ergebnis). Und wenn eine KI auf der Grundlage meiner Ideen Drehbücher und rollenspezifische Dialoge im jeweiligen Soziolekt schreibt + probeweise spricht - warum nicht? Erspart mir Monate der Recherche, Fachberater etc. Es wäre dann im Grunde genommen eine weitere Art "Regie" zu führen, ähnlich wie bei einer Schauspielprobe mit Impro. Bislang machen die Versuche damit jedenfalls Spass.))
Lieber glaub ich Wissenschaftlern, die sich mal irren, als Irren, die glauben, sie seien Wissenschaftler.



cantsin
Beiträge: 14305

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von cantsin »

Jalue hat geschrieben: Di 10 Jan, 2023 07:52 Ich finde auffallend, wie viele dieser KI-basierten Tools, gerade in unserer Branche, in den letzten Monaten auf den Markt gekommen sind. Die Frage, die ich mal in die Runde werfen möchte: Was ist da passiert? Gab es 2022 irgendeinen technologischen Durchbruch, eine neue Programmiersprache, whatever?
Es kamen die großen KI-Datenmodelle wie GPT-3, die mit Investmentmillionen von Elon Musk, Microsoft & Co. entwickelt wurden und auch die Grundlage von KI-Anwendungen wie Dall-E und ChatGPT sind.

Im Prinzip ist das einfach Big Data mit extrem rechenintensivem Maschinenlernen/neuronalen Netzen, für das man entsprechenden Kapitaleinsatz braucht - wobei die Rechner mit einer maximal verfügbaren Anzahl von Daten (wie z.B. Bild-, Text- und Tonarchiven bzw. -Internetmaterial) gefüttert werden, um dieses Material in ihrem Output faktisch zu remixen.

Für GPT-3 waren laut Nachrichtenberichten 1.024 GPUs, 34 Tage, 4,6 Millionen Dollar und 936 Megawattstunden Energie nötig, um das Modell zu trainieren. Und jetzt wird es eben in soviele Anwendungen wie möglich gegossen (von Kundendienst-Chatbots über Bildgeneratoren bis zu Suchmaschinen, Textverbesserungen etc.), damit sich diese Investments auszahlen.



cantsin
Beiträge: 14305

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von cantsin »

Drushba hat geschrieben: Di 10 Jan, 2023 10:54 Dass Risiken bestehen ist klar, aber mit KIs werden wir in der Lage sein, ziemlich schnell Probleme zu lösen, für die es keine Lösung im bisherigen Bereich gibt. Medizin, Forschung, Konstruktion, Verwaltung, Wirtschaft etc. Und wenn ein Abmahnanwalt merkt, dass er durch eine KI ersetzt werden kann und die Gesetze daraufhin verbessert werden, so dass seine Tätigkeit ohnehin sinnlos wird, dann werden seine Kids eben nicht mehr Anwalt werden, sondern etwas Interessanteres lernen.)) Auch mein Steuerberater ist der Auffassung, dass er bald überflüssig sein wird. Ich mag ihn und wünsch ihm alles Gute für die Rente - aber danach bitte das persönliche Assistenz-Abo einer KI im Preisbereich von Netflix, die mir auch die Steuer macht.))
Das heutige KI-Paradigma (Maschinenlernen mit neuronalen Netzen) ist, wie ich weiter oben auch schrieb, im Prinzip ein auf im Daten-/Trainingsmaterial erkannten Korrelationen aufgebautes Remixing. Damit kann man sehr weit kommen und interessante Dinge tun, und auch - wie Du schreibst - uninteressante Aufgaben automatisieren.

Du hast aber gerade bei kreativen Anwendungen das Problem, dass die KI immer das remixt, was sie bereits kennt, auch wenn diese Remixe sehr interessant sein können. Eine KI, die z.B. vor 100 Jahren mit Bildern von damals gängigen Stühlen trainiert worden wäre, hätte niemals einen Bauhaus-Stahlrohrstuhl entwickeln können. Und hätte man sie als Objekterkennungssystem (z.B. in einem Flughafen oder Bürogebäude) eingesetzt, hätte sie den Stahlrohrstuhl als unbekanntes und daher potentiell gefährliches Objekt eingestuft.

Und Du kriegst in Erkennungssystemen oft falsche Kausalitäten, weil Machine Learning eigentlich nur Korrelationen erfasst. Eine Brandsicherungs-machine learning-KI könnte z.B. den Schluss ziehen, dass Eis-essende Kinder im Sommer Waldbrände verursachen, weil es im Überwachungskameramaterial ein Korrelation von Waldbränden und Eis-essenden Kindern gibt. Auf die Idee, dass beides - Eis essen und Waldbrände - durch Hitze verursacht wird, würde das System nicht kommen.

Wegen des Remix-Prinzips und der unüberprüfter Annahmen aus dem Daten-Trainingsmaterial gibt es auch diverse politische Probleme mit Machine Learning-KIs, die die ehemalige Microsoft-Forscherin und heutige NYU-Professorin Kate Crawford als erste untersucht hat. (Ich gehe hier nicht in die Tiefe, um hier im Forum keine ideologischen Glaubenskriege loszuschlagen.) Es gibt von ihr auch gute Vorlesungsmitschnitte auf YouTube.

Was ich von TU-Informatikern gelernt habe: Was wir heute kommerziell und umgangssprachlich "KI" nennen, ist nur ein kleiner (wenn auch sehr erfolgreicher) Teil des Forschungsgebiets Künstliche Intelligenz. Etwa so, als wenn man das Medium Bewegtbild unzurecht auf Kino-Spielfilme reduzieren würde. Die o.g. Probleme sind auch nur spezifisch für diese spezielle Art von (Machine Learning-) KI.



Jalue
Beiträge: 1425

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Jalue »

cantsin hat geschrieben: Di 10 Jan, 2023 13:47
Jalue hat geschrieben: Di 10 Jan, 2023 07:52 Ich finde auffallend, wie viele dieser KI-basierten Tools, gerade in unserer Branche, in den letzten Monaten auf den Markt gekommen sind. Die Frage, die ich mal in die Runde werfen möchte: Was ist da passiert? Gab es 2022 irgendeinen technologischen Durchbruch, eine neue Programmiersprache, whatever?
Es kamen die großen KI-Datenmodelle wie GPT-3, die mit Investmentmillionen von Elon Musk, Microsoft & Co. entwickelt wurden und auch die Grundlage von KI-Anwendungen wie Dall-E und ChatGPT sind.

Im Prinzip ist das einfach Big Data mit extrem rechenintensivem Maschinenlernen/neuronalen Netzen, für das man entsprechenden Kapitaleinsatz braucht - wobei die Rechner mit einer maximal verfügbaren Anzahl von Daten (wie z.B. Bild-, Text- und Tonarchiven bzw. -Internetmaterial) gefüttert werden, um dieses Material in ihrem Output faktisch zu remixen.

Für GPT-3 waren laut Nachrichtenberichten 1.024 GPUs, 34 Tage, 4,6 Millionen Dollar und 936 Megawattstunden Energie nötig, um das Modell zu trainieren. Und jetzt wird es eben in soviele Anwendungen wie möglich gegossen (von Kundendienst-Chatbots über Bildgeneratoren bis zu Suchmaschinen, Textverbesserungen etc.), damit sich diese Investments auszahlen.
Vielen Dank für die kenntnisreiche Antwort! Ich finde das Thema interessant und werde es demnächst mal einem meiner Kunden vorschlagen, denn die o.g. Frage dürften sich viele stellen. Auch der Aspekt "möglicher Missbrauch", der hier schon angesprochen wurde. ist natürlich hoch spannend, nicht zuletzt: Was wir hier auf Anwender-Ebene sehen, ist vermutlich nur die Spitze des Eisbergs. Ähnliche Entwicklungen in weniger "glamourösen" Branchen laufen vermutlich unter dem Radar der Öffentlichkeit, sind aber für Arbeitnehmer oder Verbraucher ggf. noch folgenschwerer.



Jott
Beiträge: 21815

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Jott »

Wichtig ist übrigens nicht das Clooney-Nachmachen für den AB, sondern die Intonation der KI-Stiimen. Die Demos zeigen drei Sekunden echte „lustige Stimme“ oder „traurige Stimme“, und die KI-Stimme spricht dann jeden Text genauso lustig oder traurig.

Das ging bisher so nicht, ich kannte nur etwas lebloses Erklärfilm-Niveau für Anspruchslose.



klusterdegenerierung
Beiträge: 27425

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von klusterdegenerierung »

Ich muß auf jedenfall die ganze Zeit an den Anruf von letzte Tage bei meinem Vater denken, wo irgendeine Kollone wieder meinte ich hätte eine Frau umgefahren und mein Vater solle schnell Geld überweisen.

Was wenn die die Stimme Deiner Frau clonen und die Dir am Telefon sagt, die haben mich entführt etc. oder plötzlich rufst Du angeblich ständig irgedwo an und sagst schlimme Dinge?

Die Möglichkeiten sind ja grusselig!
"Was von Natur aus flach ist, bläht sich auf!"



MK
Beiträge: 4186

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von MK »

klusterdegenerierung hat geschrieben: Di 10 Jan, 2023 19:40 Was wenn die die Stimme Deiner Frau clonen und die Dir am Telefon sagt, die haben mich entführt etc. oder plötzlich rufst Du angeblich ständig irgedwo an und sagst schlimme Dinge?
Codewort für Notfälle vereinbaren.



Frank Glencairn
Beiträge: 23167

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Frank Glencairn »

Drushba hat geschrieben: Di 10 Jan, 2023 10:54

Ich glaube, es gibt jede Menge kritische Programmierer (zumindest kenn ich das von der hiesigen Uni und deren Vortragsveranstaltungen). Aber was sollte ein "kritischer Programmierer" machen, wenn diverse Konzerne oder Forschungseinrichtingen daran arbeiten? Destruction-Bots in Umlauf bringen?)) Ich finde dass wir - im Gegenteil - auf riesige Chancen zusteuern. Allerdings liegt es tief im deutschen Wesen begraben, allen Fortschritt pessimistisch zu betrachten und am Wochenende eher auf Naturwanderungen und Mittelaltermärkte zu gehen, als Technologie auszuprobieren (und trotzdem kamen viele historische Neuerungen aus Deutschland und ich will nicht wissen, was sich ein Carl Benz von Zeitgenossen anhören musste, die genauso konservativ gestrickt waren wie heute.))).

Das Problem ist doch eher, dass wir am Ende nicht nur technisch, sondern auch mental abgehängt sein werden, wenn wir alles verneinen.
Wir sind ja eher selten einer Meinung, aber hier gebe ich dir völlig Recht.
Bei jeder neuen Technik ist der Deutsche-Reflex erst mal - OMG, das kann missbraucht werden.
Sapere aude - de omnibus dubitandum



Darth Schneider
Beiträge: 19512

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Darth Schneider »

Dabei missbraucht oder gebraucht wird doch absolut alles was Dollars bringt, sogar schöne Musik…;)))

Gruss Boris



Darth Schneider
Beiträge: 19512

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Darth Schneider »

@Kluster
Das diese Technik (und auch andere KI bezogene High End Tools, sehr wahrscheinlich weit fortgeschrittener als wir uns jetzt das bewusst sind, bei den führenden Geheimdiensten und bei Industrie Spionage schon längst im Einsatz sind. Davon können wir wohl alle ausgehen.

Jetzt stell dir mal die endlosen und sehr gefährlichen Möglichkeiten in dem Bereich nur vor…

Von dem her denke ich, dein gruseliges Gefühl dabei ist völlig berechtigt.;)

Aber nicht nur, die Enkel von Isaac Asimov (oder wer war das ?) träumen womöglich diesmal von wirklich (nicht nur) echten K.I. Roboter Schafen…;)))
Gruss Boris



klusterdegenerierung
Beiträge: 27425

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von klusterdegenerierung »

Frank Glencairn hat geschrieben: Di 10 Jan, 2023 20:40
Drushba hat geschrieben: Di 10 Jan, 2023 10:54

Ich glaube, es gibt jede Menge kritische Programmierer (zumindest kenn ich das von der hiesigen Uni und deren Vortragsveranstaltungen). Aber was sollte ein "kritischer Programmierer" machen, wenn diverse Konzerne oder Forschungseinrichtingen daran arbeiten? Destruction-Bots in Umlauf bringen?)) Ich finde dass wir - im Gegenteil - auf riesige Chancen zusteuern. Allerdings liegt es tief im deutschen Wesen begraben, allen Fortschritt pessimistisch zu betrachten und am Wochenende eher auf Naturwanderungen und Mittelaltermärkte zu gehen, als Technologie auszuprobieren (und trotzdem kamen viele historische Neuerungen aus Deutschland und ich will nicht wissen, was sich ein Carl Benz von Zeitgenossen anhören musste, die genauso konservativ gestrickt waren wie heute.))).

Das Problem ist doch eher, dass wir am Ende nicht nur technisch, sondern auch mental abgehängt sein werden, wenn wir alles verneinen.
Wir sind ja eher selten einer Meinung, aber hier gebe ich dir völlig Recht.
Bei jeder neuen Technik ist der Deutsche-Reflex erst mal - OMG, das kann missbraucht werden.
Sehe ich anders, als der CD Brenner kam habe ich nicht an den Untergang der Musikindustrie gedacht. :-)
"Was von Natur aus flach ist, bläht sich auf!"



MK
Beiträge: 4186

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von MK »

klusterdegenerierung hat geschrieben: Mi 11 Jan, 2023 20:43 Sehe ich anders, als der CD Brenner kam habe ich nicht an den Untergang der Musikindustrie gedacht. :-)
Da hat ein Rohling auch noch 50 Mark gekostet ;-)



Darth Schneider
Beiträge: 19512

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Darth Schneider »

Früher gab es in der Musik Industrie viel mehr Superstars…
Aber wo sind jetzt die neuen jungen Music Superstars ?

Adele, Billy, Dua Lippa, Taylor Swift….
Viel mehr ist da gar nicht mehr.

Und die Ur alten Stones und der nicht jüngere Elton füllen mit weit über 70 die Konzerthallen immer noch mit Abstand am meisten…

Früher hatte ich für Musik regelmässig wirklich nicht wenig Geld ausgegeben, seit dem Steaming praktisch gar nix mehr…
Geht ja alles über sooo einfach und voll gratis YouTube und Co…
Wie geht diesbezüglich es euch ?;))

Fazit:
Das mit dem Music Streaming war ein Riesen Fehler, oder bisher völlig falsch umgesetzt…
Arme Musiker !!!

Und jetzt kommt die KI…
Gruss Boris



Blackbox
Beiträge: 448

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Blackbox »

Auch in der Musik:
Aldi und Armani.
Die ausgeweitete Menge der 'Mitte' der Musikschaffenden verdient immer weniger, hat kaum noch lukrative Verkaufs- und Auftrittsmöglichkeiten, viele AddOn Jobs fallen weg, während die heutigen Top-'Stars' zugleich sehr viel mehr verdienen als die Top-stars der Schallplatten- und CD-Ära.



Bluboy
Beiträge: 4410

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Bluboy »

Darth Schneider hat geschrieben: Mi 11 Jan, 2023 22:21 Früher gab es in der Musik Industrie viel mehr Superstars…
Aber wo sind jetzt die neuen jungen Music Superstars ?

Adele, Billy, Dua Lippa, Taylor Swift….
Viel mehr ist da gar nicht mehr.

Und die Ur alten Stones und der nicht jüngere Elton füllen mit weit über 70 die Konzerthallen immer noch mit Abstand am meisten…

Früher hatte ich für Musik regelmässig wirklich nicht wenig Geld ausgegeben, seit dem Steaming praktisch gar nix mehr…
Geht ja alles über sooo einfach und voll gratis YouTube und Co…
Wie geht diesbezüglich es euch ?;))

Fazit:
Das mit dem Music Streaming war ein Riesen Fehler, oder bisher völlig falsch umgesetzt…
Arme Musiker !!!

Und jetzt kommt die KI…
Gruss Boris
RTL bietet 9 Millionen Songs zum streamen, das reicht für mehrere Generaionen



Darth Schneider
Beiträge: 19512

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Darth Schneider »

@bluboy
Nur dumm das ist es halt das die allermeisten Musiker genau deswegen immer ärmer werden.
Es ging mir ja gar nicht um die Anzahl Songs die es gibt.
Klar sind die Songs viel zahlreicher geworden, aber heute kann auch absolut jeder der absolut kein Talent hat, irgend einen Song mit Garage Band selber kreieren und in O Time in die Welt hochladen..

Früher ging das ausschliesslich über ein Label, über einen Musik Produzenten.
Also da man musste noch wirklich vorspielen und wirklich was können..;))))
Gruss Boris



Bluboy
Beiträge: 4410

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Bluboy »

Noch garnicht so lange her da war die Rede von, Youtube bietet unbekannten künstlern eine Plattform, eine Chance, ein Sprungbrett
hat sich daran was geändert ?



Darth Schneider
Beiträge: 19512

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Darth Schneider »

Wie viele schaffen den Sprung zum Erfolg vom YouTube Sprungbrett ?
0,001% ?
Ich denke das ist noch sehr optimistisch geschätzt.

Also beim Lotto zu gewinnen oder im Casino zu spielen sind die Chancen zum Erfolg nicht viel kleiner..

YouTube macht vor Allem mit dem Modell, selber Geld ohne Ende !
Gruss Boris
Zuletzt geändert von Darth Schneider am Sa 14 Jan, 2023 08:40, insgesamt 1-mal geändert.



Bluboy
Beiträge: 4410

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Bluboy »

Ich stell Dir vor dass Microsoft Ki integriert und bei Eingabe Elvis lebt, der dann tagelang noch nie dagewesene Songs trällert

Einfach Toll, ich freu mich schon.



Darth Schneider
Beiträge: 19512

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von Darth Schneider »

@bluboy
So gesehen hast du natürlich recht.
Jede Wette, in 10 bis 20 Jahren können sie Elvis dann einfach so klonen…;))

Aber blöderweise die Supersoldaten und AFD Wähler dann halt ganz einfach auch…
Ups !

Es hat alles immer mindestens 2 Seiten
Gruss Boris



soulbrother
Beiträge: 389

Re: OpenAI VALL-E: Neue KI macht jede Stimme nach - nur anhand von 3s Stimmsample

Beitrag von soulbrother »

Bin gespannt, wann die ersten Betrugsfälle bekannt werden.
Gibt ja z.B. die Gaunerfirmen, die behaupten, man hätte (bei deren Kaltaquiseanruf!) telefonisch ein Abo abgeschloßen, oder dies oder jenes bestellt....
Die können jetzt aus den kurzen Gesprächen komplette "Bestellungen" zaubern...



 Aktuelle Beiträge [alle Foren]
 
» Messevideo: Atomos NINJA PHONE erklärt
von Frank Glencairn - Do 6:06
» Was schaust Du gerade?
von roki100 - Do 1:00
» NAB 2024 Neuigkeiten
von pillepalle - Do 1:00
» Was hörst Du gerade?
von roki100 - Do 0:12
» Was hast Du zuletzt gekauft?
von Jörg - Mi 22:30
» Flackern bei der Digitalisierung - USB Grabby
von Laboriosa - Mi 20:53
» Canon öffnet RF-Mount - Erste Objektive von Sigma (18-50 mm f/2.8) und Tamron (11-20 mm f/2,8)
von cantsin - Mi 20:26
» Tragischer Unfall am Set trotz Filmwaffe: Kamerafrau stirbt nach Schuß von Alec Baldwin
von iasi - Mi 19:53
» SmallRig @ NAB 2024: Potato Jet Stativ, Brandon Li Cage, VB212 Akku
von iasi - Mi 19:46
» Panasonic S5 - Allgemeine Fragen, Tipps und Tricks, Zeig deine Bilder/Videos usw.
von roki100 - Mi 19:32
» Tieraufnahmen mit dem MKE600 + H1 Essential rauschen
von mikroguenni - Mi 18:46
» Avid Liquid 7.2 installieren
von unikator2022 - Mi 18:29
» Insta360 X4 360°-Action-Kamera filmt in 8K
von matthew - Mi 17:19
» >Der LED Licht Thread<
von Darth Schneider - Mi 17:06
» Retention Video Editing ist tot
von DeeZiD - Mi 16:56
» Resolve-Mac, 5000€
von Franz86 - Mi 14:34
» Apple Vision Pro: Verkaufsstart (USA) ab Februar für 3.499,- Dollar + neuer Werbeclip
von cantsin - Mi 13:39
» Audition CS6 > Arbeitsbereich aus Versehen gelöscht
von Herbie - Mi 12:10
» DJI Power 500 und 1000: Mobile Powerstations mit bis zu 1.024 Wh
von slashCAM - Mi 9:27
» Atomos Neon 24 - 4K HDR-Grading Display-Recorder
von teichomad - Mi 9:14
» Atomos Ninja als HDMI-Recorder
von Saint.Manuel - Mi 8:41
» DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt
von freezer - Mi 8:20
» Meine erste Kritik in Filmthread :-)
von Frank Glencairn - Mi 8:12
» Kostenloser Fairlight Workshop mit Mary Plummer
von Frank Glencairn - Mi 6:31
» AMDs Notebook APU Strix Halo - besser als Apples M3 Pro Chip?
von macaw - Mi 6:31
» Musikvideo Floridas Klaus "Che Guevara"
von MK - Di 18:37
» Realistischer und mehr Details - Adobe Firefly Image 3 Model für Web und Photoshop
von slashCAM - Di 14:48
» Adobe Firefly KI jetzt auch mobil in neuer Express App verfügbar
von slashCAM - Di 14:15
» Z Cam E2G, E2C, E2-6F, E2-S6, E2-F8
von Clemens Schiesko - Di 13:45
» Canon öffnet RF-Mount - aber nur für APS-C
von stip - Di 10:10
» Linsen (Vintage, Anamorphic & Co.)
von Frank Glencairn - Di 9:35
» Cannes 2024
von 7River - Di 9:28
» Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.
von Frank Glencairn - Di 9:24
» Woody Allen: Coup de Chance (ab Herbst 2023, Venedig)
von Skeptiker - Di 8:19
» Panasonic HC X2000 und Rode
von rush - Mo 21:02