[11:20 Mo,21.November 2022 [e] von Rudi Schmidts] |
Das klingt spannend: Meta / Facebook Research haben einen KI-basierten Audio-Codec namens Encodec vorgestellt, der es (zumindest auf dem Forschungspapier) wahrlich in sich hat. Dieser soll gegenüber MP3-Dateien gerade bei sehr geringen Datenraten bei vergleichbarer Qualität noch einmal eine um den Faktor 10 bessere Kompression erzielen.
![]() Der Aufbau von Encodec (Bildquelle: Meta) Laut Meta könne Encodec so Audio mit niedriger Bitrate (64 kb/s) ohne Qualitätsverlust rekonstruieren und habe zudem noch Potenzial für weitere Verbesserungen. So trainierte man zusätzlich ein Transformer-basiertes Sprachmodell, das bei gleichbleibender Qualität weitere 40 Prozent Bandbreite einsparen könnte, wenn die Latenz wie beim Streaming nicht entscheidend sei. Anders gesagt, wenn der Encoder nicht in Echtzeit arbeiten muss, sind für MP3-Audio-Anwendungen noch größere Kompressionsgewinne möglich. Spezielle Hardware ist für den Einsatz interessanterweise ebenfalls nicht notwendig. Ein einzelner CPU-Kern soll zum En- und Decoding mit dem neuen Verfahren in Echtzeit ausreichen. Und damit immer noch nicht genug. Meta hat angekündigt, mit KI in einem kommenden Forschungsvorhaben auch Video effektiver komprimieren zu wollen. ![]() |
![]() |