Die Musikbranche erlebt gerade ihren Sora-Moment. Ende März erschien Suno, ein KI-Dienst, mit dem sich ziemlich passable Musikstücke samt Gesang beliebig aus Prompts generieren lassen, und gerade einmal zwei Wochen später wird Suno nun wiederum von einem weiteren Song-Generator in den Schatten gestellt. Denn die KI-generierten Tracks, die Udio in verschiedenen Genres ausgibt, sind in vielen Fällen für Laien nun tatsächlich nicht mehr als synthetisch erstellt zu erkennen.
Selbst die gesungenen Lieder klingen echt, die menschlichen Stimmen und ja, sogar die von den Stimmen ausgedrückte Emotionalität durchaus "authentisch". Auf uns wirken die Lieder mit Gesang beinahe noch überzeugender als die Instrumentalstücke, da man sich kaum vorstellen kann, dass diese Stimmen nicht real sind - das ist das wirklich Revolutionäre an den Tracks auf Udio. Da sie sich leider nicht direkt einbetten lassen, einige Links zum Reinhören: Beispiel 1, Beispiel 2, Beispiel 3, Beispiel 4, Beispiel 5.
Sind es Hits? Nicht unbedingt, aber das sind auch die wenigsten menschengemachten Songs. Eine gewisse Beliebigkeit oder Repetitionen in den melodischen Abfolgen und den Songstrukturen ist nicht zu leugnen, doch auch dies kennt man ja ebenso von Menschenmusik. Hier und da kommt eine unerwartete Wendung im musikalischen Flow, das ist eher ungewohnt - nicht alles ist gleich gut. Je standardisierter das Genre, umso treffsicherer gelingt meist der generierte Song - Country, Pop, Heavy Metal, Singer/Songwriter-Balladen, Punk, Deutsch-Rap und vieles mehr umfasst das Repertoire. Sogar Stand-up Comedy. Bei klassischen "Kompositionen" fliegt das ganze dagegen schon deutlich eher als generiert auf. Und ein bißchen blechern klingt die Soundqualität ja auch noch.
einfach weil ich den ersten deutschen Udio Song posten wollte 🤣 nichts besonderes. Aber für "freundschaft" und "90s rap" eingeben und 10 sekunden warten AUCH nicht viel schlimmer als alles an Deutschrap in den 90s.
— Snicklink (@snicklink) April 10, 2024
Tacheles: noch lachen wir, aber... it&s over ! 😅
trust me. pic.twitter.com/fwpwg4l0hw
Eigene Musik einfach generieren - gratis
Das Generieren der Musikstücke ist momentan, solange Udio noch in Beta ist, kostenlos nach einer Anmeldung (bis zu 1200 (!) Songs monatlich) und grundsätzlich denkbar einfach, wie bei allen generativen KI-Diensten. Man tippt seine Wunschvorstellung eines Tracks ein und gibt noch wegweisende Tags bezüglich Stimmung, Genre etc. dazu oder wählt zwischen Vorschlägen aus. Auch lassen sich manche Namen von Musikern eingeben, deren Stil das Stück ähneln soll - Billie Holiday ist erlaubt, Beastie Boys dagegen nicht. Den Songtext ersinnen die KI-Algorithmen gleich passend dazu, wenn man keinen eigenen dazugeben möchte.
Ausgegeben wird daraufhin eine 32-sekündige musikalische Sequenz, quasi das Herzstück, welche sich bei Gefallen um weitere Sequenzen oder ein Intro/Outro erweitern läßt, bis ein kompletter Song steht. Auch der Songtext läßt sich bearbeiten. In einem manuellen Modus stehen weitere Kontrollmöglichkeiten über die Songgenerierung zur Verfügung - das genaue Vorgehen wird in einem FAQ beschrieben. Zukünftig sollen noch weitere Möglichkeiten wie die Generierung von Stems oder der Audio-Input von Melodien/Rhythmen wie bei Stable Audion 2.0 dazukommen.
Die Udio-Entwickler sind ehemalige Mitarbeiter von Google Deepmind und träumen von einer Welt, in der sich jeder einfach seine eigenen, maßgeschneiderten Songs erstellt, passend zur jeweiligen Situation und den persönlichen Vorlieben. Woran ihre Musik-KI trainiert wurde, dazu gibt es allerdings keine Angaben - in einem Interview sprechen sie lediglich von "öffentlich zugänglicher" Musik und erwähnen auch, dass es einen sehr großen Trainigskorpus braucht, um diese guten Resultate zu erreichen. Inwieweit die Udio-Algorithmen an tatsächlich zu diesem Zweck lizensierter Musik trainiert wurden, dürfte ziemlich sicher eine gerichtliche Frage werden, denn für professionelle Musiker steht nun viel auf Spiel.
Aufschrei in der Musik-Szene
Passend dazu erschien vor einigen Tagen, als Reaktion auf die Suno-Vorstellung, bereits ein offener Brief, unterzeichnet von über 200 Musikern und Musikerinnen wie Billie Eilish u.v.a., in dem die KI-Industrie aufgefordert wird, die Rechte von Künstlern (wörtlich sogar menschlichen Künstlern, human artists) nicht weiter zu mißachten und ihre Arbeit zu entwerten.
Und in der Tat, mit dem Start von Udio wird klar, dass KIs wohl in naher Zukunft jedwede Musik generieren werden, ohne dass dies noch als maschinengemacht zu erkennen sein wird - eine Flut KI-generierter Songs samt virtueller Pop-Stars wird die Folge sein. Können sich menschliche Musiker dagegen durchsetzen? Welche Rolle sie sonst zukünftig haben werden, ob als reine Live-Interpreten, als avancierte Musikprompter, als Stimmenlizenzgeber oder anderes, wird sich zeigen. Und nichtzuletzt auch davon abhängen, wie sich die rechtlich eher unübersichtliche Situation entwickelt.
Die von den KI-Apologeten gerne als "Demokratisierung" per KI bezeichnete Entwicklung, dass jeder/jede nun quasi ein Maler/Regisseur/Autor und jetzt eben auch Komponist/Musiker sein kann, unabhängig des eigenen Talents, wird jedenfalls weitreichende Folgen haben - auf unser Verständnis von Kunst und Kreativität ebenso wie auf die Möglichkeit, mit Kunst bzw. professioneller Arbeit mit Bildern, Texten oder Musik seinen Lebensunterhalt verdienen zu können.