Aus Text wird nun auch Audio: Stable Audio generiert Musik und Soundeffekte per KI

// 13:08 Mo, 18. Sep 2023von blip

Mit Stable Diffusion hat Stability AI bereits einen guten Text-to-Image KI-Bildgenerator am Start. Seit kurzem ist nun auch Stable Audio online verfügbar, ein neues Diffusionsmodell mit dem sich - der Name sagt es schon - Audio und Musik aus Textprompts erstellen läßt.

Aus Text wird nun auch Audio: Stable Audio generiert Musik und Soundeffekte per KI

Das Stable Audio Modell wurde zu diesem Zweck anstelle von Bildern mit verschiedenen Audioinputs trainiert. Verwendet wurden über 800.000 - lizensierte - Dateien der Audiobibliothek AudioSparks inklusive der jeweiligen Metadaten. Durch dieses kontextreiche Training ist das Modell in der Lage, gepromptete Vorgaben bezüglich Inhalt und Form recht gut einzuhalten, und auch den Output auf die genaue Länge zu timen. Um das Modell auf eine Verbindung zwischen Text und Audio zu konditionieren, wurde beim Training eine Technik namens Contrastive Language Audio Pretraining (CLAP) eingesetzt - genaueres dazu in diesem Blog-Beitrag, in dem auch gute Audiobeispiele eingebettet sind.

Stable Audio, latent diffusion model — Stable Audio, latentes Diffusionsmodell

Generieren lassen sich sowohl Musikstücke mit bis zu 90 Sekunden Länge, als auch einzelne Instrumentspuren oder auch Soundeffekte. Vorgeben lassen sich das Genre, der Stil, die Stimmung, die Instrumentierung, die Geschwindigkeit in BPM und mehr - im Grunde alles, was bei Audiobibliotheken üblicherweise über die Metadaten definiert wird. In einem User-Guide hat StabilityAI einige Prompt-Beispiele zusammengetragen, die von kurz und knackig bis mehrzeilig ausfallen.

// Top-News auf einen Blick:

Die resultierenden Musikstücke klingen wenig hitverdächtig, um nicht zu sagen teilweise recht erratisch "komponiert". Wobei es auch auf die Art Musik ankommt und auf die Länge; ruhige, ambient-artige Tracks lassen sich z.T. kaum von der typischen, GEMA-freien Hintergrundmusik unterscheiden. Eher brauchbar scheinen uns grundsätzlich die kürzeren Sound-Schnipsel, welche sich als Effektuntermalung generieren lassen, oder vielleicht minimalistisch gehaltene Instrumentausgaben.

Stable Audio ist in einer kostenlosen Version zugänglich, mit welcher sich pro Monat 20x bis zu 45 Sekunden lange Tracks generieren lassen. Das Pro-Abo für 12 Dollar im Monat erlaubt 500 Generierungen von bis zu 90 Sekunden Länge, welch auch in kommerziellen Projekten genutzt werden dürfen. Der Download erfolgt in 44.1 kHz Stereo.

Auch ein Open Source-Modell von Stable Audio soll demnächst veröffentlicht werden, allerdings wird dies mit einem anderen Datensatz trainiert worden sein, aus Lizenzgründen darf man annehmen.

mehr Infos bei
www.stableaudio.com

Auf Socials teilen:

Leserkommentare // Neueste

Drushba // 14:31 am 19.9.2023

Also die Ergebnisse für klassische Musik sind .... schräg erhellend.)) Sicher gut verwendbar für atmosphärisches Hintergundrauschen, das von atonalen Musikfetzen durchdrungen...weiterlesen

Cinemator // 13:17 am 19.9.2023

Eignet sich vielleicht ganz gut für Imagefilme von Fahrstuhlherstellern. Na ja, es ist immerhin ein Anfang...

Anonymous // 07:30 am 19.9.2023

ROFL. Ich bin ja ein Aphex Twin Fan und damit IDM Fan, was aber bei der Eingabe von IDM rauskam, klang wie eine totale Kakophonie...

Im Forum mitdiskutieren >>

Ähnliche News //

News

KI goes Hollywood James Cameron wird Mitglied im Vorstand von Stability AI

Nachdem das erste Hollywood Studio einen Deal mit einem Video-KI Anbieter eingegangen ist folgt nun die Nachricht, dass James Cameron, einer der erfolgreichsten Regisseure und ...

// 16:39 Do, 26. Sep 2024von Thomas Richter

News

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Forscher von Google haben eine neue KI vorgestellt, die nach einem ähnlichen Muster wie die gerade sehr populären Text-2-Image KIs wie DALL-E 2, Midjourney oder Stable Diffusion .....

// 10:57 Mo, 30. Jan 2023von Thomas Richter

News

Stable Diffusion XL: KI-Bilder werden fotorealistischer

Stable Diffusion ist ein Open Source KI Bildgenerator, der sich gerade aufgrund seiner Offenheit großer Beliebtheit erfreut. So ist Stable Diffusion grundsätzlich frei verfügbar .....

// 14:48 Sa, 10. Jun 2023von Rudi Schmidts

News

Audio-KI von StabilityAI Stable Audio 2.0 produziert kostenlos Musik per KI

StabilityAI, vor allem bekannt durch seine Open-Source Bild-KI Stable Diffusion, hat die zweite Version seiner Audio-KI veröffentlicht. Sie ist jetzt in der Lage, ist bis zu drei ....

// 13:10 Di, 9. Apr 2024von Thomas Richter

News

Stable Video Diffusion - Freies KI-Diffusionsmodell zur Videoerzeugung vorgestellt

Natürlich war es nur eine Frage der Zeit, bis auch das Stable Diffusion Team ein eigenes KI-Modell für Bewegtbilder ins Rennen schicken würde und dieser Tag ist nun gekommen. ...

// 09:07 Do, 23. Nov 2023von Rudi Schmidts

zur Newsübersicht >

Roadmap 2026/2027 Apple plant OLED-MacBook Pro, Mac Studio M6 Ultra und Mini-LED Studio Display

Laut dem stets zuverlässigen Apple Insider Mark Gurmann wird Apple 2026 eine ganze Reihe an neuen Produkten vorstellen. Erwartungsgemäß sind darunter - wie jedes Jahr - Modell-...

// 11:05 Do, 13. Nov 2025von Thomas Richter

Test

Entry-Level Cinema Kamera Canon EOS C50 im Praxistest: Kompaktes Arbeitstier mit 7K 50p Raw - die neue FX3 Konkurrenz

Mit der EOS C50 rundet Canon sein Cinema EOS Portfolio nach unten hin ab und bringt gleichzeitig einen direkten Konkurrenten zur erfolgreichen Sony FX3 auf den Weg. Wir haben uns ...

// 15:55 Do, 13. Nov 2025von Rob

Test

Hosentaschen-Alexa iPhone 17 Pro Max mit ProRes RAW - Rolling Shutter und Dynamik Sensortest

Wir hatten das iPhone 17 Pro Max bei uns im Sensortest. Und auch wenn sich bei der Signalverarbeitung grundsätzlich wenig Neues getan hat, überraschten uns die Ergebnisse mit ...

// 22:08 Fr, 7. Nov 2025von Rudi Schmidts

Test

Alive and Kicking Blackmagic Pocket Cinema Camera 4K Sensor-Test - Wiedersehen mit ProRes RAW

Nachdem Blackmagic seinem Pocket Kamera-Klassiker ein unerwartetes ProRes RAW Update beschert hat, fragen wir uns, für wen sich das neue RAW Format eigentlich lohnt...

// 13:49 Fr, 31. Okt 2025von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

Aktuelles

Sparen beim Geschenkekauf Weihnachtsangebote für Kameras, Objektive und mehr von Sony, Canon, Nikon, Panasonic, MSI, ...

Wer Anderen oder sich selbst zu Weihnachten eine Kamera, ein besonderes Objektiv, eine Drohne oder etwa einen Laptop schenken will, kann dank der aktuellen speziellen ...

// 18:52 Mi, 11. Dez 2024von Thomas Richter

zur Artikelübersicht >

Aktuelle News //

News

Mit Anamorphotenlinse? Neue Insta360 Ace Pro 2 Videografie-Bundles verfügbar

Seine 8K-Actioncam Ace Pro 2 verkauft Insta360 nun auch in zwei neuen Videography-Kits, die bei der Nutzung ein klassisches Kamera-Feeling aufkommen lassen sollen. Um die kleine .....

// 14:58 Mo, 17. Nov 2025von blip

News

5-Zoll HDMI-Kameramonitor Portkeys LH5C - 800 Nits und Kamerasteuerung für 222 Euro

Von Portkeys ist ein neuer, günstiger HDMI-Kameramonitor verfügbar, der mit kompatiblen Kameras eine kabelgebundene Kamerasteuerung bietet. Dieses zunächst professionelleren ...

// 10:22 So, 16. Nov 2025von blip

zur Newsübersicht >