Logo Logo
/// 

Ratgeber : Mac Studio mit M1 Ultra - Volle Workstation-Performance?

von Mi, 23.März 2022 | 4 Seiten | diesen Artikel auf einer Seite lesen

 Einleitung
 Ungeschlagene Effizienz
 Vorteil?: Unified Memory - Zero-Copy-Speicherzugriff

Mit dem Erscheinen des neuen Mac Studio Desktops präsentierte Apple auch ein weiteres mal spektakuläre Vergleiche zum neuen M1 Ultra Prozessor, die unter anderem suggerierten, dass Apple nun mit seinem Spitzenmodell in einer Liga mit AMD / Intel / Nvidia Workstations spielt. Wir wagen uns an eine realistische Einschätzung.



Ungeschlagene Effizienz



Zuerst darf und muss man vor Apples Stromverbrauch den Hut ziehen: Die Effizienz der neuen Systeme bleibt einzigartig. Vergleichbare Leistung ließe sich mit PC-Komponenten zwar mit großem Aufwand vielleicht noch ebenso kompakt verpacken, dann jedoch keinesfalls derart leise betreiben. Dies erreicht Apple jedoch nicht mit Magie, sondern mit dem (sehr kostspieligen) Zugriff auf die aktuell kleinsten Strukturen der Halbleiter-Massenfertigung von TSMC (5nm). Erst in diesem Spätherbst werden AMD und Nvidia ebenfalls konkurrierende CPUs und GPUs in dieser Strukturbreite auf den Markt bringen, wobei zu erwarten ist, dass damit der Effizienz-Vorsprung gegenüber Apples M1-Architektur deutlich schrumpfen wird.



Auch heute lassen sich bereits günstigere PC-basierte Systeme zusammenstellen, die selbst einen Mac Studio im Maximalausbau noch deutlich überflügeln. Doch bei solchen Aussagen kommt es stark auf das Anwendungsszenario an. Apple selbst hat in sehr speziell ausgewählten Benchmarks zum Vergleich eine RTX 3090 sowie einen AMD Threadripper herangezogen, der angeblich auf Augenhöhe agiert. Je nach Benchmark kamen diverse Internetmedien jedoch auch zu ganz anderen Ergebnissen. An einem Beispiel wollen wir kurz erklären, warum die Varianz der Tests so groß ausfällt:



Vorteil?: Unified Memory - Zero-Copy-Speicherzugriff



Als einer der größten Vorteile für die Videobearbeitung (und übrigens auch für Machine Learning) gilt der sogenannte Zero-Copy-Speicherzugriff der M1 Unified Memory Architektur zwischen CPU, GPU und anderen SOC-Komponenten. Hierbei übergibt beispielsweise die CPU der GPU statt der Daten nur einen sogenannten Zeiger auf die Daten. Da CPU und GPU Zugriff auf denselben Speicher haben, müssen diese Daten zur Weiterverarbeitung nicht mehr vom CPU-Speicher in den GPU-Speicher transferiert werden.

Wenn dieser Zero-Copy-Speicherzugriff im Code der Applikation genutzt wird (wofür in der Regel ein geänderter Code-Ablauf erforderlich ist), kann der M1 hiermit signifikante Performance-Steigerungen erzielen. Leider ist nicht einmal bekannt, ob schon Final Cut Pro diese Funktionen rege nutzt. Die großen Machine Learning Anwendungen könnten ebenfalls stark davon profitieren, nutzten diesen Vorteil aktuell jedenfalls noch nicht.

Ein echter Vergleich zwischen PC- und M1-Architektur kann deswegen niemals fair ausfallen, weil man keine identische Codebasis zum Vergleich heranziehen kann. Entweder ist der Code für ein hin- und herschieben von Speicherblöcken zwischen CPU und GPU am PC optimiert oder er macht explizit Gebrauch von dem Unified Memory Modell des Mac. Bei ersterem könnte die CPU noch parallel für andere Aufgaben genutzt werden, weil die GPU mit ihrem eigenen Speicher autark (z.B. die Effekt-Threads für die Videobearbeitung ab-) arbeiten kann.

Bei Unified Memory spart man sich zwar den eigentlichen Kopiervorgang, dafür können sich CPU und GPU bei RAM-Zugriffen behindern und die Bandbreite des Speichers muss sorgfältig(er) geteilt werden. Wer für beide Architekturen optimiert, hat am Ende sehr unterschiedlichen Code. Je nach Effekt-Algorithmus kann die eine oder andere Architektur von Vorteil sein.

Grob darf man wohl annehmen: Wenn mehrere Effekte verkettet werden und diese "in einem Rutsch" auf der GPU berechnet werden können, spielt der Aufwand des Kopiervorgangs nur eine untergeordnete Rolle. Unified Memory kann dagegen seine Vorteile vor allem dort ausspielen, wo viele Kopiervorgänge relativ unaufwändigen Berechnungen gegenüberstehen. In Resolve würden wir dies bei gestackten Nodes mit einfacher Farbkorrektur erwarten. Weil eben hier wenig Rechenaufwand bei häufiger Pixelschubserei von Node zu Node anfällt. Bei einer sehr rechenintensiven temporalen Noise Reduction sehen wir dagegen weniger Vorteile für Zero-Copy Speicherzugriffe. In praktischen Benchmarks spiegelt sich unsere Erwartung jedoch nicht unbedingt wieder, was viele Gründe haben kann, die wir ohne Einblick in den Code jedoch nicht erklären können. Doch dazu schreiben wir ein andermal noch einmal mehr.

TFlops als Anhaltspunkt / Eigenheiten der Videobearbeitung


4 Seiten:
Einleitung / Ungeschlagene Effizienz / Vorteil?: Unified Memory - Zero-Copy-Speicherzugriff
TFlops als Anhaltspunkt / Eigenheiten der Videobearbeitung
Preis-Leistung / Aussichten
Fazit
  

[34 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
TheBubble    11:07 am 6.5.2022
Nur ein wenig Rauschunterdrückung? Sozusagen also nur etwas, das beliebig viel Rechenleistung verbrauchen kann? Dafür keine leistungsbeinträchtigenden Farbeffekte? Ab hier...weiterlesen
freezer    10:52 am 6.5.2022
Ich bin mir nicht sicher, was ich von dem Artikel halten soll. Für einen Macwelt Redakteur ist das ziemlich oberflächlich und das dümmliche Titelbild peinlich. So viel...weiterlesen
Axel    05:36 am 6.5.2022
Das war immer so, dass das teuerste Apple-Modell das mit dem miesesten Preis-Leistungsverhältnis ist (z.B. MP 2013, MP 2019, iMP). Das Fiepen lässt sich angeblich mit einem...weiterlesen
[ Alle Kommentare ganz lesen]

Weitere Artikel:


Ratgeber: Casting-Tipps für die Low Budget Produktion Di, 15.Juni 2021
Dieser Artikel war bei uns in Arbeit, als Corona die Notwendigkeit für Castings (nicht nur) im Low-Budget Filmbereich plötzlich implodieren ließ. Doch wer jetzt wieder mit einem eigenen Film loslegen will, könnte die folgenden Tipps vielleicht ganz praktisch finden...
Ratgeber: Smartphone für Filmer - worauf beim Kauf achten? Mo, 20.August 2018
Das Filmen mit dem Smartphone unterscheidet sich wesentlich vom Filmen mit anderen Bewegtbildlösungen. Tatsächlich ergeben sich bei mobilen Android / iOS Geräten teils völlig andere Prioritäten bei den zentralen (Video)funktionen. Hier unser Ratgeber worauf bei der Wahl eines Handys für´s Filmen zu achten wäre ...
Ratgeber: Sind blaue LEDs Augenkiller? Mythos, Wahrheit und Tipps zum Umgang mit blauen Spektralanteilen Di, 14.August 2018
Man stolpert bei Monitorherstellern immer häufiger über Kleingedrucktes und seltsame Filtermethoden für einen reduzierten Blauanteil. Ein Grund hierfür könnte tatsächlich in der Sorge zu finden sein, ansonsten für Augenschäden der Benutzer haftbar gemacht zu werden. Richtig gehört und weitergelesen...
Ratgeber: Speedbooster: Vorteile und Nachteile für MFT, am Beispiel der Panasonic GH5 Do, 18.Mai 2017
Ratgeber: QuickTime-Sicherheitslücke: Was tun? Mo, 25.April 2016
Ratgeber: Die slashCAM-Produkte des Jahres 2007 – Schnittprogramme Mo, 7.Januar 2008
Ratgeber: Die slashCAM Camcorder Kauftipps So, 11.Februar 2007
Ratgeber: Quad-und Oktal-Systeme für Overclocker zum Einstiegspreis Mi, 13.Dezember 2006
Ratgeber: Das optimale Schnittsystem Teil 1: Festplatten und Partitionen Di, 5.April 2005
Workshop: KI hilft mit - Die Magic Mask in Davinci Resolve 18 Mo, 23.Mai 2022


[nach oben]


[nach oben]















Artikel-Übersicht



Artikel-Kategorien:



update am 23.Mai 2022 - 15:39
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*