Meta Encodec komprimiert mit KI Audio-Dateien deutlich stärker als MP3

// 11:20 Mo, 21. Nov 2022von Rudi Schmidts

Das klingt spannend: Meta / Facebook Research haben einen KI-basierten Audio-Codec namens Encodec vorgestellt, der es (zumindest auf dem Forschungspapier) wahrlich in sich hat. Dieser soll gegenüber MP3-Dateien gerade bei sehr geringen Datenraten bei vergleichbarer Qualität noch einmal eine um den Faktor 10 bessere Kompression erzielen.

Dies würde bedeuten, dass sich hiermit MP3-Audiodateien noch einmal durchschnittlich auf ein Zehntel ihres Datenspeicherbedarfs reduzieren ließen. Dies hätte wiederum enorme Auswirkungen auf offline Speicherung und Audio-Streaming.

Der Aufbau von Encodec erinnert dabei stark an typische VACs/GANs. Der Kompressor erzeugt Samples, die ein folgender Diskriminator als echt oder rekonstruiert klassifiziert. Das Kompressionsmodell modifiziert daraufhin seinen Output so lange, bis der Diskriminator alle Samples für echt hält. Gleichzeitig lernt der Diskriminator auch immer verlässlicher "echt" von "rekonstruiert" zu unterscheiden. Dieses Wechselspiel perfektioniert die Audioqualität anschließend bei minimalem Dateneinsatz im Modell.

The structure of Encodec (image source: Meta) — Der Aufbau von Encodec (Bildquelle: Meta)

// Top-News auf einen Blick:

Laut Meta könne Encodec so Audio mit niedriger Bitrate (64 kb/s) ohne Qualitätsverlust rekonstruieren und habe zudem noch Potenzial für weitere Verbesserungen. So trainierte man zusätzlich ein Transformer-basiertes Sprachmodell, das bei gleichbleibender Qualität weitere 40 Prozent Bandbreite einsparen könnte, wenn die Latenz wie beim Streaming nicht entscheidend sei. Anders gesagt, wenn der Encoder nicht in Echtzeit arbeiten muss, sind für MP3-Audio-Anwendungen noch größere Kompressionsgewinne möglich.

Spezielle Hardware ist für den Einsatz interessanterweise ebenfalls nicht notwendig. Ein einzelner CPU-Kern soll zum En- und Decoding mit dem neuen Verfahren in Echtzeit ausreichen.

Und damit immer noch nicht genug. Meta hat angekündigt, mit KI in einem kommenden Forschungsvorhaben auch Video effektiver komprimieren zu wollen.

mehr Infos bei
github.com

Auf Socials teilen:

Leserkommentare // Neueste

cantsin // 17:33 am 21.11.2022

Wenn's um Streaming geht, ist jedes eingesparte Bit ein handfester Vorteil (hinsichtlich Bandbreite, Serverkapazität, Energiekosten etc.). Wobei mp3 ja mittlerweile ein 31...weiterlesen

teichomad // 17:04 am 21.11.2022

MP3 Dateigrößen waren ein Problem ?

Im Forum mitdiskutieren >>

Ähnliche News //

News

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Forscher von Google haben eine neue KI vorgestellt, die nach einem ähnlichen Muster wie die gerade sehr populären Text-2-Image KIs wie DALL-E 2, Midjourney oder Stable Diffusion .....

// 10:57 Mo, 30. Jan 2023von Thomas Richter

News

Google Research VideoPoet - mehr Konsistenz für KI-Bewegtbilder durch LLMs

Passend zur Weihnachts- und damit Geschichten-Zeit stellt Google Research VideoPoet vor. Hierbei handelt es sich auf den ersten Blick einfach nur um ein weiteres KI-Modell zur ...

// 11:06 Fr, 22. Dez 2023von Rudi Schmidts

News

Großes Blackmagic DaVinci Resolve 18.5 Update bringt über 150 neue Funktionen

Blackmagic hat gerade eine neue Version seines kostenlosen Grading-, Schnitt-, Compositing- und Audio-Mastering-Programms DaVinci Resolve vorgestellt. Das neue Resolve 18.5 in der ...

// 20:05 So, 16. Apr 2023von Thomas Richter

News

Missbrauchsgefahr Microsoft VALL-E 2: KI ahmt jede Stimme perfekt nach - nur per 3s Stimmsample

Schon vor anderthalb Jahren hatte OpenAI VALL-E veröffentlicht, ein System zur Sprachsynthese, welches anhand eines nur 3 Sekunden langen Samples einer Stimme in der Lage war, ...

// 10:07 Do, 18. Jul 2024von Thomas Richter

News

Meta setzt neue Maßstäbe Neue Video-KI Movie Gen kommt mit Killerfeature

Meta hat Movie Gen vorgestellt, ein neues KI-Modell zur Generierung von Videos, welches gleich mehrere interessante Funktionen mitbringt. Neben der Möglichkeit, hochwertige Videos ...

// 17:49 Sa, 5. Okt 2024von Thomas Richter

zur Newsübersicht >

GPU-Krise 2026 Neue Gerüchte: Nvidia soll die GPU-Produktion 2026 um 30-40% runterfahren

Wie erwartet, weiten sich die direkten und indirekten Folgen der von Sam Altmann verursachten Speicherkrise aus - neben massiv teureren Speichermodulen, PCs und SSDs trifft es ...

// 19:07 Mi, 17. Dez 2025von Thomas Richter

News

KI-Boom trifft SSD-Markt Leak: Samsungs plant SATA-Aus - Kommt der Preisschock auch bei SSDs?

Neuen Gerüchten von MooresLawIsDead zufolge will Samsung aus der Produktion von SATA-SSDs aussteigen; angekündigt werden soll dies im Januar. Ein solcher Schritt hätte kurz- und .....

// 19:11 Mo, 15. Dez 2025von Thomas Richter

News

Anstieg bei Kameraverkäufen Kompaktkameras wieder im Trend - trotz Smartphones

Als im April unerwartet viele DSLMs verkauft wurden - 36% mehr als im Vorjahresmonat -, stellte sich die Frage nach einer möglichen Trendwende auf dem Kameramarkt. Ob sich die ...

// 15:32 Mo, 15. Dez 2025von blip

Test

Nachgefasst Sony FX3 Sensor-Test - Dynamik, Debayering und Rolling Shutter

Die Sony FX3 ist eine der wenigen relevanten Kameras, die wir bislang nicht in unserem Dynamik-Vergleichstest testen konnten - was wir hiermit endlich nachholen wollen.

// 13:51 Mi, 10. Dez 2025von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Test

Sennheiser MKH 8060 im ersten Test: Die neue slashCAM Audio-Referenz? Inkl. MKH 416 Vergleich

Die 8000er Serie stellt die aktuellste Version von Sennheisers weit etablierter, professioneller MKH-Serie dar. Innerhalb des 8000er Mikrofon-Portfolios ordnet Sennheiser dem ...

// 08:11 Mo, 23. Jan 2023von Rob

Wissen

Pro und Contra Layer- vs. Node-basiertes Compositing - Welcher Workflow wann passt

Bei Compositing-Systemen gibt es grundsätzlich zwei unterschiedliche Workflow-Ansätze, den Node-basierten Ansatz sowie das Layer-basierte Arbeiten. Beide Ansätze haben dabei Vor- ...

// 11:32 Fr, 22. Aug 2025von Rudi Schmidts

zur Artikelübersicht >

Aktuelle News //

News

Neue Studio Displays und mehr Apple Roadmap 2026 - iMac Pro mit M5 Max und MacBooks mit M6 geplant

Wir hatten ja schon vor rund einem Monat dank des Apple Insiders Mark Gurman einen groben Einblick in Apples Roadmap fürs nächste und übernächste Jahr bekommen; jetzt sind noch ...

// 13:02 Do, 18. Dez 2025von Thomas Richter

News

Resolve & Fusion Fixes Blackmagic DaVinci Resolve 20.3.1 Update

Blackmagic hat gerade die neue Version 20.3.1 seines kostenlosen Grading-, Schnitt-, Compositing- und Audio-Mastering-Programms DaVinci Resolve (Windows/macOS/Linux/Windows for ...

// 11:14 Do, 18. Dez 2025von Thomas Richter

zur Newsübersicht >