Kann Chat GPT Bilder besser verlustfrei komprimieren als PNG?

// 10:24 Mo, 2. Okt 2023von Rudi Schmidts

Was passiert eigentlich, wenn man ein Bild verlustfrei komprimiert? Um Daten zu komprimieren, muss man in den Daten wiederkehrende Muster finden. Daraufhin kann man diese speichersparend zusammenfassen. Also statt 10110 10110 10110 schreibt man beispielsweise kürzer 3 x 10110. Hiermit lässt sich in der Regel bereits einiges an Speicherplatz sparen.

Bei einer verlustfreien Kompression muss das komprimierte Bild nach dem "Entpacken" wieder mit dem Originalbild bis auf das letzte Bit übereinstimmen.

Und wie funktioniert ein Large Language Model (LLM) à la ChatGPT? Hier versucht ein KI-Modell, die nächsten Worte in einer Wort-Sequenz zu erraten. GPT kann hiermit immer Sätze so weiterschreiben, wie sie höchstwahrscheinlich in einem Originaltext weitergeführt werden würden. Hierfür muss GPT ebenso Muster im vorgegebenen Text erkannt haben.

Kann Chat GPT Bilder besser verlustfrei komprimieren als PNG?

Mustererkennung und daraus eine Vermutung anzustellen, wie sich eine Datenfolge weiterentwickelt, verbindet somit die beiden Welten. Doch können große Sprachmodelle und effektive, verlustfreie Bildkompression in der Praxis wirklich viel miteinander zu tun haben?

In dem arXiv-Forschungspapier mit dem Titel "Language Modeling Is Compression" legen Forscher nun einen solchen Zusammenhang nahe. So haben sie erstaunlicherweise entdeckt, dass das DeepMind LLM namens Chinchilla 70B eine verlustfreie Komprimierung von Bildpatches aus der ImageNet-Bilddatenbank auf 43,4 Prozent ihrer ursprünglichen Größe durchführen kann - und damit sogar den bewährten PNG-Algorithmus übertrifft, der dieselben Daten "nur" auf 58,5 Prozent komprimierte. Für Audio komprimierte Chinchilla Samples aus dem LibriSpeech-Audiodatensatz auf nur 16,4 Prozent ihrer Rohgröße und übertraf damit die übliche FLAC-Komprimierung mit 30,3 Prozent. In beiden Fällen handelt es sich um eine verlustfreie Komprimierung (lossless).

// Top-News auf einen Blick:

Das wirklich Seltsame an den überraschend guten Kompressions-Ergebnissen ist jedoch, dass Chinchilla 70B hauptsächlich für den Umgang mit Text trainiert wurde - und nun trotzdem überraschend effektiv bei der Komprimierung anderer Arten von Daten ist. In den zwei betrachteten Fällen sogar noch besser als Algorithmen, die speziell für diese Aufgaben entwickelt wurden. Damit dürfte wohl feststehen, dass KI-Modelle in Zukunft auch bei der Bild- und Audio-Kompression eine größere spielen werden.

Doch es gibt natürlich auch ein paar kritische Anmerkungen zu dieser Meldung, die gerade in IT- und KI-Kreisen große Wellen schlägt. Erstens ist das Paper noch nicht peer-reviewed, weshalb sich durchaus ein Fehler eingeschlichen haben könnte. So wäre denkbar, dass Chinchilla 70B bei seinem Training irgendwie Zugriff auf die ImageNet-Bilddatenbank sowie auf den LibriSpeech-Audiodatensatz hatte. Und damit die Daten schon durch das eigene Training kannte.

Zudem sollte man nicht die Größe des "Decoders" aus dem Auge verlieren. Um eine PNG-Datei zu dekomprimieren, reicht in der Regel ein sehr kleines Programm mit wenigen KB-Code aus, während ein Chinchilla 70B Modell als Decoder mehrere parallel geschaltete Hochleistungs-GPUs und hunderte GB GPU-RAM benötigt.

Solche KI-Kompressoren sind also keineswegs effizient bezüglich Speicherverbrauch oder Rechenleistung. Und werden es vermutlich auch nicht in absehbarer Zeit sein.

mehr Infos bei
arstechnica.com

Auf Socials teilen:

Leserkommentare // Neueste

dienstag_01 // 14:19 am 2.10.2023

Danke für den Tipp.

Skeptiker // 13:33 am 2.10.2023

Wichtiger Hinweis, vielen Dank für den interessanten Artikel. Da ging's um die Entdeckung 2013, dass Xerox-Kopierer systematisch "Zahlendreher" (bzw. Ersatzzahlen) als...weiterlesen

AndySeeon // 12:33 am 2.10.2023

Bei „Erraten“ fällt mir doch gleich wieder Xerox ein (Stichwort „David Kriesel“). Gruß, Andreas

Im Forum mitdiskutieren >>

Ähnliche News //

News

GPT-4 kommt schon schon nächste Woche: KI für Text, Bild- und Video

Heise hatte bereits am Donnerstag als erster darüber berichtet, dass bei der Microsoft-Veranstaltung "KI im Fokus – Digitaler Kickoff" fast beiläufig erwähnt wurde, dass GPT-4 ...

// 11:03 Sa, 11. Mär 2023von Rudi Schmidts

News

Neue Version 25.3 Adobe Premiere Pro ab sofort mit 4:2:2 Beschleunigung per Nvidia GPU und mehr

Adobe hat die neue Version 25.3 von Adobe Premiere Pro (Juni 2025) veröffentlicht, die einige interessante neue Funktionen mitbringt, wie etwa eine GPU-Beschleunigung für 4:2:2-...

// 09:39 Mi, 18. Jun 2025von Thomas Richter

News

Prompten statt sichten? Eddie AI schneidet automatisch Rough-Cuts aus Interview-Footage

Ein neu vorgestellter KI-Dienst bietet seine Dienste als Schnittassistent an - mit Eddie AI sollen sich innerhalb weniger Sekunden verschiedene Rough Cuts aus Interview-Footage ...

// 18:14 Mi, 9. Okt 2024von blip

News

Künstler vs KIs: Neues Tool macht Kunstwerke für KIs unverdaulich

Der Boom bildgenerierender KIs, die per Prompt beliebige Bilder erzeugen, hat bei Künstlern große Ängste ausgelöst, kann doch jeder Kunst- oder Künstlerstil - egal ob Malerei, ...

// 19:51 Mo, 20. Feb 2023von Thomas Richter

News

Stimme geklaut? Scarlett Johansson kritisiert OpenAI: ChatGPT spricht wie ich

Scarlett Johansson wollte ihre Stimme nicht für ChatGPT zur Verfügung stellen. Trotzdem klingt eine der ChatGPT 4.0 Stimmen - Sky - ihr zum Verwechseln ähnlich - warum?

// 19:06 Di, 21. Mai 2024von blip

zur Newsübersicht >

Hollywood as a Service? ARRIs Color KnowHow könnte Millionen Wert sein - als Workflow Lizenz für Dritte

Kamera-Hardware und die Color-Science in der Firmware waren bei ARRI bislang untrennbar verbunden. Doch muss das auch weiterhin so sein?

// 15:44 Mo, 17. Nov 2025von Rudi Schmidts

Test

Entry-Level Cinema Kamera Canon EOS C50 im Praxistest: Kompaktes Arbeitstier mit 7K 50p Raw - die neue FX3 Konkurrenz

Mit der EOS C50 rundet Canon sein Cinema EOS Portfolio nach unten hin ab und bringt gleichzeitig einen direkten Konkurrenten zur erfolgreichen Sony FX3 auf den Weg. Wir haben uns ...

// 15:55 Do, 13. Nov 2025von Rob

Test

Hosentaschen-Alexa iPhone 17 Pro Max mit ProRes RAW - Rolling Shutter und Dynamik Sensortest

Wir hatten das iPhone 17 Pro Max bei uns im Sensortest. Und auch wenn sich bei der Signalverarbeitung grundsätzlich wenig Neues getan hat, überraschten uns die Ergebnisse mit ...

// 22:08 Fr, 7. Nov 2025von Rudi Schmidts

Test

Alive and Kicking Blackmagic Pocket Cinema Camera 4K Sensor-Test - Wiedersehen mit ProRes RAW

Nachdem Blackmagic seinem Pocket Kamera-Klassiker ein unerwartetes ProRes RAW Update beschert hat, fragen wir uns, für wen sich das neue RAW Format eigentlich lohnt...

// 13:49 Fr, 31. Okt 2025von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Sparen beim Geschenkekauf Weihnachtsangebote für Kameras, Objektive und mehr von Sony, Canon, Nikon, Panasonic, MSI, ...

Wer Anderen oder sich selbst zu Weihnachten eine Kamera, ein besonderes Objektiv, eine Drohne oder etwa einen Laptop schenken will, kann dank der aktuellen speziellen ...

// 18:52 Mi, 11. Dez 2024von Thomas Richter

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

zur Artikelübersicht >

Aktuelle News //

News

Top Deals für Filmemacher Erste Black Friday Angebote von Atomos, Nanlite, DZOFILM und mehr

Die vielen Rabattaktionen rund um den Black Friday (der dieses Jahr auf den 28. November fällt) sind immer wieder eine gute Gelegenheit für ein Schnäppchen - gerade wenn man ...

// 12:24 Di, 18. Nov 2025von Thomas Richter

News

Leichte Budget-Optiken Meike und Viltrox mit neuen 85mm Portrait-Telebrennweiten

Für Kameras mit Sony E- und Nikon Z-Mount erscheinen zwei neue, günstige Objektive, das Viltrox AF 85mm F2.0 EVO sowie das Meike 85mm f/1.8 SE II. Letzteres ist eine überarbeitete ...

// 09:48 Di, 18. Nov 2025von blip

zur Newsübersicht >