Stimme geklaut? Scarlett Johansson kritisiert OpenAI: ChatGPT spricht wie ich

// 19:06 Di, 21. Mai 2024von

Vor gut einer Woche stellte OpenAI das neue GPT-4o vor, eine neue, nativ multimodale Generation des KI-Modells, welches Text, Bild und Ton gleichermaßen beherrscht und künftig zum KI-Assistenten ausgebaut werden soll. Diese Funktionalität ist noch nicht ganz vorhanden, doch bereits jetzt ist das Modell in der Lage, auch visuellen Input über die Kamera als "Gesprächsgrundlage" zu nehmen. Für das Modell gibt es fünf verschiedene Stimmen zur Auwahl.


Sprechende, intelligente Computersysteme kennt man aus diversen Science Fiction-Filmen, etwa HAL 9000 in Kubricks "2001" oder, etwas zeitgemäßer, Samantha in Spike Jonzes Film "Her" (2013). Letzterer soll erklärterweise ein Lieblingsfilm von OpenAIs CEO Sam Altman sein - am Vorstellungstag von GPT-4o postete er sogar "her" auf X (ehemals Twitter), ohne weiteren Kommentar.



In "Her" war damals Scarlett Johansson als Samantha zu hören. Wie nun bekannt wird, hatte Altman letzten September angefragt, ob sie ihre Stimme auch für eine sprechende ChatGPT-Instanz zur Verfügung stellen wolle, doch Johansson lehnte ab. Trotzdem klang eine der ChatGPT 4.0 Stimmen - Sky - ihr zum Verwechseln ähnlich, wie die Schauspielerin letzte Woche "schockiert und verärgert" feststellte. (Tatsächlich ist die Stimme bereits seit September implementiert, als ChatGPT erstmals sprechen lernte - im Blogbeitrag sind auch Stimmbeispiele enthalten.)



"When I heard the released demo, I was shocked, angered and in disbelief that Mr. Altman would pursue a voice that sounded so eerily similar to mine that my closest friends and news outlets could not tell the difference. Mr. Altman even insinuated that the similarity was intentional, tweeting a single word “her” - a reference to the film in which I voiced a chat system, Samantha, who forms an intimate relationship with a human.



Two days before the ChatGPT 4.0 demo was released, Mr. Altman contacted my agent, asking me to reconsider. Before we could connect, the system was out there."



Um herauszufinden, wie diese Sky-Stimme genau entstanden ist, hat Johansson nun Anwälte eingeschaltet. Laut OpenAI gehen alle fünf ChatGPT-Stimmen (Breeze, Cove, Ember, Juniper und Sky) jeweils auf individuelle Stimmschauspieler zurück, welche aus 400 Bewerbungen ausgewählt wurden. Wessen Stimme Sky bekam, könne aus Privacy-Gründen nicht öffentlich gemacht werden:



"We believe that AI voices should not deliberately mimic a celebritys distinctive voice—Sky’s voice is not an imitation of Scarlett Johansson but belongs to a different professional actress using her own natural speaking voice. To protect their privacy, we cannot share the names of our voice talents."



Obwohl die Stimme somit keine "Nachahmung" sei, will OpenAI dennoch die Sky-Stimme vorübergehend nicht mehr anbieten, bis die Sache geklärt sei. Auf Reddit wurden die Stimmen im direkten Vergleich gepostet:





Wir finden diese Angelegenheit aus zweifacher Hinsicht bemerkenswert. Denn erstens ist es im Lichte der oben erwähnten Begeisterung Altmans wohl ziemlich unwahrscheinlich, dass rein aus Zufall eine Stimme ausgewählt wurde, die Samantha / Johansson sehr ähnlich klingt. Auch wenn - was sich hoffentlich nachweisen läßt - OpenAI ihre eigene Stimme nicht für das Training verwendete, wurde also ihr Wunsch, den Chatbot nicht wie sie klingen zu lassen, wenig respektiert. Wenn man bedenkt, dass OpenAI einige der besten, generativen KI-Dienste entwickelt hat (ChatGPT, Dall-E, Sora), und dass diese auf noch nicht gänzlich abhersehbare Weise Folgen für unsere Gesellschaft und Arbeitswelt haben werden, würden zumindest wir uns grundsätzlich ein etwas umsichtigeres Vorgehen wünschen.



Und zweitens sind wir gespannt, welche Karten Johansson hier in der Hand hat. Wir denken, nicht besonders Gute, denn sollte OpenAI "nur" eine sehr ähnliche Stimme einer anderen Schauspielerin verwendet haben, läßt sich dagegen rechtlich vielleicht nicht viel unternehmen (bislang wurden nur anwältliche Nachfragen verschickt). Natürlich wurden beliebte Stars immer schon kopiert oder als Vorlage verwendet, wenn die Kopien nun jedoch rein virtuell werden, handelt es sich nicht mehr um einzelne Fälle, sondern das Ganze skaliert in völlig andere Größenordnungen. Wer hat das Copyright an seiner eigenen Stimme, Erscheinung, Persona? Wie weit ist eine Ähnlichkeit gestattet, wann beginnt ein "Personenplagiat"?





Fragen wie diese werden uns mit den kommenden KI-Agenten, KI-Influencern, KI-"Sängern" und -"Schauspielern" vermutlich häufiger beschäftigen.






Ähnliche News //
Umfrage
    Meine nächste Kamera wird eine










    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash