slashCAM
Administrator
Administrator
Beiträge: 11279

FFmpeg bis zu 94x schneller durch handoptimierten AVX-512 Assembler-Code

Beitrag von slashCAM »


Besitzer von CPUs mit der AVX-512 Befehlssatzerweiterung dürfen sich freuen: die Entwickler des Open Source-Tools FFmpeg haben genau dafür per Hand optimierten Assembler-...

Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
FFmpeg bis zu 94x schneller durch handoptimierten AVX-512 Assembler-Code



exi
Beiträge: 16

Re: FFmpeg bis zu 94x schneller durch handoptimierten AVX-512 Assembler-Code

Beitrag von exi »

Wie verhält sich dieser handopitimierte Code mit Apples CPUs der M-Reihe?



cantsin
Beiträge: 16647

Re: FFmpeg bis zu 94x schneller durch handoptimierten AVX-512 Assembler-Code

Beitrag von cantsin »

exi hat geschrieben: Sa 09 Nov, 2024 12:57 Wie verhält sich dieser handopitimierte Code mit Apples CPUs der M-Reihe?
Gar nicht.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



Frank Glencairn
Beiträge: 26509

Re: FFmpeg bis zu 94x schneller durch handoptimierten AVX-512 Assembler-Code

Beitrag von Frank Glencairn »

FFmpeg geht zwar, ist aber ein PITA - z.B. über Homebrew, Xcode, mit Neon compilen oder binaries aus ner anderen Anwendung extrahieren.

Also nix für den geneigten Klickdrauf-User.

AVX-512 spricht Apple Silicon allerdings gar nicht, da hast du natürlich recht.
Sapere aude - de omnibus dubitandum



cantsin
Beiträge: 16647

Re: FFmpeg bis zu 94x schneller durch handoptimierten AVX-512 Assembler-Code

Beitrag von cantsin »

Interessant wäre jetzt zu erfahren, welche real life-Performancegewinne mit ffmpegs neuem AVX-512-Code und einer passenden CPU erzielt werden. "Bis zu 94x schneller" bezieht sich ja auf eher synthetische Labor-Spitzenwerte. Wo greift der AVX-512-Assembler-Code genau: bei allen Codecs, oder nur bei wenigen? Auch bei x264/x265 als den häufigst gebrauchten Codecs? Wenn ja, was sind dann typische, mittlere Performancegewinne?

Das wäre doch mal ein Job für einschlägige YouTuber. Leider kann ich da noch nichts dergleichen finden.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



Onkel Danny
Beiträge: 501

Re: FFmpeg bis zu 94x schneller durch handoptimierten AVX-512 Assembler-Code

Beitrag von Onkel Danny »

Hier der Tom's Hardware Artikel dazu und hier der darauf basierende
Golem Artikel

Ich bezweifel aber, das es alle Fragen beantworten wird.
Zuletzt geändert von Onkel Danny am So 10 Nov, 2024 11:24, insgesamt 1-mal geändert.



cantsin
Beiträge: 16647

Re: FFmpeg bis zu 94x schneller durch handoptimierten AVX-512 Assembler-Code

Beitrag von cantsin »

Frank Glencairn hat geschrieben: So 10 Nov, 2024 07:40 FFmpeg geht zwar, ist aber ein PITA - z.B. über Homebrew, Xcode, mit Neon compilen oder binaries aus ner anderen Anwendung extrahieren.
Da Handbrake, Shutter Encoder & Co. auf ffmpeg basieren bzw. aufsetzen, landen die neuen AVX512-Optimierungen bald auch in diesen Programmen.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



 Aktuelle Beiträge [alle Foren]
 
» diashow - wie lange jedes bild?
von wabu - Do 9:59
» Endlich mal wieder originelle Ansätze im Kino
von cantsin - Do 0:19
» Blackmagic DaVinci Resolve 20.2.1 bringt Verbesserung fürs Editing und mehr
von Jott - Mi 19:50
» LETsDOK Dokumentarfilmtage 2025 bringt über 70 Dokus in Kinos und TV
von slashCAM - Mi 16:30
» Stabileye
von Phil999 - Di 14:30
» Neuer Atomos Ninja TX, Shinobi 7RX + neuer Reference Monitor erklärt
von MarcusG - Di 14:20
» Atomos Sun Dragon - 5-Farben-HDR-LED-Lichtstreifen mit CRI99 Lichtgüte
von Asjaman - Di 8:59
» !!BIETE!! ZEAPON MICRO 2 Slider 54cm bis 5KG
von klusterdegenerierung - Mo 23:40
» !!BIETE!! ZEAPON Easylock 2 Tisch Stativ für MICRO 2 Slider
von klusterdegenerierung - Mo 20:23
» !!BIETE!! ZEAPON Motor für MICRO 2 Slider
von klusterdegenerierung - Mo 20:22
» !!BIETE!! TILTA Nucleus Nano I
von klusterdegenerierung - Mo 17:10
» ALEXA 35 Update: ARRICORE für Xtreme & neue Features für alle Modelle
von slashCAM - Mo 15:18
» Was hörst Du gerade?
von Funless - Mo 14:46
» DaVinci Cache auf welche SSD?
von dienstag_01 - Mo 12:57
» DJI MIC 2 - XLR Adapter
von rush - Mo 12:17
» Was tun, wenn das Wasser fehlt? Klimawandelfolgen-Doku Teil 2
von Darth Schneider - Mo 6:37
» Caspar David Friedrich - Filter
von Axel - So 13:39
» iPhone 17 Pro: ProRes RAW, Genlock, Apple Log 2 und Blackmagic ProDock für Filmer
von Axel - So 13:27
» Wiegt die DJI Mini 5 Pro wirklich unter 250 Gramm?
von Jost - So 10:46
» Aputure NOVA II 2x1 - 1.000W LED-Panel mit BLAIR-CG-Engine
von Jominator - So 10:31
» Neue Funktionen für Frame.io verbessern Sicherheit und Sharing
von slashCAM - So 9:33
» Apple Final Cut Camera 2.0 bringt iphone 17 Pro Apple Log 2, Genlock und Open Gate
von vaio - Sa 12:40
» Nikon NRAW als RED RAW prozessieren
von cantsin - Sa 11:48
» Canon Cinema EOS C50 Sensor-Bildqualität - Debayering, Rolling Shutter und Dynamik
von Walter Schulz - Sa 9:40
» Leitz Hektor - sechs Cine-Objektive für DSLM & Co vorgestellt
von philr - Sa 9:25
» DR Lüftergeräusche + Windgeräusche rausfiltern
von Jott - Sa 8:25
» Überraschung: Kyno 1.9 ist erschienen mit Apple Silicon Support und neuem Design
von slashCAM - Fr 15:24
» Hardware für Creators - Die besten 4K/8K Schnittrechner - Frühling 2025
von Mayk - Fr 13:23
» Resolve Color Grading Tutorials
von freezer - Fr 11:18
» Nvidia + Intel arbeiten an gemeinsamen SoC
von markusG - Fr 10:09
» Video mit KI bearbeiten
von Bluboy - Do 23:33
» AI-Diskussionsthread - Pro/Kontra?
von cantsin - Do 19:12
» Twixtor Probleme mit Marking Points
von Jott - Do 19:03
» Welches Update für Ursa MiniPro 12K?
von Jost - Do 17:47
» Neue Luma AI Ray3 Video-KI erstellt erstmals Clips mit nativem HDR
von slashCAM - Do 15:04