Ratgeber

Mac Studio mit M1 Ultra - Volle Workstation-Performance?

Spielt Apples M1 Ultra Prozessor wirklich in einer Liga mit AMD / Intel / Nvidia Workstations? Wir wagen uns an eine realistische Einschätzung...

// 10:04 Mi, 23. Mär 2022von Rudi Schmidts

Mit dem Erscheinen des neuen Mac Studio Desktops präsentierte Apple auch ein weiteres mal spektakuläre Vergleiche zum neuen M1 Ultra Prozessor, die unter anderem suggerierten, dass Apple nun mit seinem Spitzenmodell in einer Liga mit AMD / Intel / Nvidia Workstations spielt. Wir wagen uns an eine realistische Einschätzung.

Ungeschlagene Effizienz

Zuerst darf und muss man vor Apples Stromverbrauch den Hut ziehen: Die Effizienz der neuen Systeme bleibt einzigartig. Vergleichbare Leistung ließe sich mit PC-Komponenten zwar mit großem Aufwand vielleicht noch ebenso kompakt verpacken, dann jedoch keinesfalls derart leise betreiben. Dies erreicht Apple jedoch nicht mit Magie, sondern mit dem (sehr kostspieligen) Zugriff auf die aktuell kleinsten Strukturen der Halbleiter-Massenfertigung von TSMC (5nm). Erst in diesem Spätherbst werden AMD und Nvidia ebenfalls konkurrierende CPUs und GPUs in dieser Strukturbreite auf den Markt bringen, wobei zu erwarten ist, dass damit der Effizienz-Vorsprung gegenüber Apples M1-Architektur deutlich schrumpfen wird.

Mac Studio mit M1 Ultra - Volle Workstation-Performance? : effizienz m1

Auch heute lassen sich bereits günstigere PC-basierte Systeme zusammenstellen, die selbst einen Mac Studio im Maximalausbau noch deutlich überflügeln. Doch bei solchen Aussagen kommt es stark auf das Anwendungsszenario an. Apple selbst hat in sehr speziell ausgewählten Benchmarks zum Vergleich eine RTX 3090 sowie einen AMD Threadripper herangezogen, der angeblich auf Augenhöhe agiert. Je nach Benchmark kamen diverse Internetmedien jedoch auch zu ganz anderen Ergebnissen. An einem Beispiel wollen wir kurz erklären, warum die Varianz der Tests so groß ausfällt:

Vorteil?: Unified Memory - Zero-Copy-Speicherzugriff

Als einer der größten Vorteile für die Videobearbeitung (und übrigens auch für Machine Learning) gilt der sogenannte Zero-Copy-Speicherzugriff der M1 Unified Memory Architektur zwischen CPU, GPU und anderen SOC-Komponenten. Hierbei übergibt beispielsweise die CPU der GPU statt der Daten nur einen sogenannten Zeiger auf die Daten. Da CPU und GPU Zugriff auf denselben Speicher haben, müssen diese Daten zur Weiterverarbeitung nicht mehr vom CPU-Speicher in den GPU-Speicher transferiert werden.

Wenn dieser Zero-Copy-Speicherzugriff im Code der Applikation genutzt wird (wofür in der Regel ein geänderter Code-Ablauf erforderlich ist), kann der M1 hiermit signifikante Performance-Steigerungen erzielen. Leider ist nicht einmal bekannt, ob schon Final Cut Pro diese Funktionen rege nutzt. Die großen Machine Learning Anwendungen könnten ebenfalls stark davon profitieren, nutzten diesen Vorteil aktuell jedenfalls noch nicht.

Ein echter Vergleich zwischen PC- und M1-Architektur kann deswegen niemals fair ausfallen, weil man keine identische Codebasis zum Vergleich heranziehen kann. Entweder ist der Code für ein hin- und herschieben von Speicherblöcken zwischen CPU und GPU am PC optimiert oder er macht explizit Gebrauch von dem Unified Memory Modell des Mac. Bei ersterem könnte die CPU noch parallel für andere Aufgaben genutzt werden, weil die GPU mit ihrem eigenen Speicher autark (z.B. die Effekt-Threads für die Videobearbeitung ab-) arbeiten kann.

Bei Unified Memory spart man sich zwar den eigentlichen Kopiervorgang, dafür können sich CPU und GPU bei RAM-Zugriffen behindern und die Bandbreite des Speichers muss sorgfältig(er) geteilt werden. Wer für beide Architekturen optimiert, hat am Ende sehr unterschiedlichen Code. Je nach Effekt-Algorithmus kann die eine oder andere Architektur von Vorteil sein.

Grob darf man wohl annehmen: Wenn mehrere Effekte verkettet werden und diese "in einem Rutsch" auf der GPU berechnet werden können, spielt der Aufwand des Kopiervorgangs nur eine untergeordnete Rolle. Unified Memory kann dagegen seine Vorteile vor allem dort ausspielen, wo viele Kopiervorgänge relativ unaufwändigen Berechnungen gegenüberstehen. In Resolve würden wir dies bei gestackten Nodes mit einfacher Farbkorrektur erwarten. Weil eben hier wenig Rechenaufwand bei häufiger Pixelschubserei von Node zu Node anfällt. Bei einer sehr rechenintensiven temporalen Noise Reduction sehen wir dagegen weniger Vorteile für Zero-Copy Speicherzugriffe. In praktischen Benchmarks spiegelt sich unsere Erwartung jedoch nicht unbedingt wieder, was viele Gründe haben kann, die wir ohne Einblick in den Code jedoch nicht erklären können. Doch dazu schreiben wir ein andermal noch einmal mehr.

TFlops als Anhaltspunkt

Ein ziemlich robustes Kriterium für die nackte Rechenleistung sind jedoch TFlops-Werte. Diese geben an, wie viele Standard Rechenoperationen eine GPU schaffen kann - sofern der Speicher den Algorithmus schnell genug zu füttern vermag. Wegen letzterer Voraussetzung ist die RAM-Geschwindigkeit für die Berechnung von aufwändigen Videoeffekten ebenfalls sehr wichtig: Kommen die Daten nicht schnell genug nach, nützen auch schnelle Recheneinheiten nichts.

Apple selbst sieht in einem selbst gewählten und darum sicherlich wohlwollenden Resolve GPU-Benchmark den M1 Max (10,4 TFLOPS) knapp vor einer AMD W5700X (9,4 TFLOPS). Als maximale Rechenleistung gibt Apple für die Ultra GPU 20,9 FP32-TFlops an, die in ca. 80 Prozent Leistungsvorsprung gegenüber den genannten 10 TFlops GPUs umgesetzt werden:

Mac Studio mit M1 Ultra - Volle Workstation-Performance? : Bench ultra

Eine RTX3090 schafft bei voller Auslastung jedoch fast die doppelte Rechenleistung (ca. 36 TFlops). Die in ein paar Tagen erwartete RTX 3090 Ti soll sogar runde 40 TFlops schaffen.

Apple gibt für den schnellsten M1 Ultra zudem eine RAM-Anbindung von ca. 800 GB/s an, wovon die GPU schätzungsweise maximal 660 GB/s direkt nutzen kann. Dagegen schaffen alle Desktop RTX3080/90-Modelle über 900 GB/s, die sie zudem nicht mit der CPU teilen müssen. Bei optimierter Programmierung auf beiden Seiten ist daher anzunehmen, dass ein System mit RTX3090 Ti Desktop-GPU im Durchschnitt bei aufwändigen Effekten sogar doppelt so schnell arbeiten könnte wie das größte Mac Studio Ultra. Allerdings müsste der Code dafür auch gut an die RTX 3090 angepasst worden sein.

Eigenheiten der Videobearbeitung

Doch genau dies ist nie hundertprozentig der Fall. Letztlich entscheidet darum die Implementierung in der Applikation mindestens ebenso über die Performance wie die nackten Hardware-Specs. So kann für den Videoschnitt viel entscheidender sein, wie gut und breit Hardware-Decoder im System unterstützt werden.

Bei den neuen Macs darf die Unterstützung vorbildlich genannt werden, am PC deckt die größte Bandbreite an Hardware-Decodern aktuell Intel ab. Ob dabei die für einen persönlich wichtigsten Codecs unterstützt werden, sollte unbedingt in die Wahl der eigenen Hardware-Software-Kombination einfließen.

Auch wird in naher Zukunft sicherlich die Unterstützung von KI-Beschleunigern eine weitaus größere Rolle spielen. Aktuell scheint für KI-Algorithmen eine Nvidia Karte mit Tensor Cores die beste Wahl. Die Leistung der integrierten KI-Einheiten in der M1 Architektur sind dagegen noch ein großes Fragezeichen. Wie effektiv diese bereits genutzt werden, ist noch größtenteils unbekannt.

Auf Apples Seite ist das am besten optimierte Videobearbeitungs-Programm definitiv Final Cut Pro, auf dem PC herrscht dagegen weitaus mehr Wildwuchs. Resolve konnte in der Vergangenheit sowohl Macs als auch Windows-Hardware meist sehr gut "ausfahren". Für systemübergreifende Vergleiche wird DaVinici Resolve mittlerweile von vielen Testern genutzt, da Blackmagic dieses Programm für diverse Plattformen ausgiebig optimiert. Im Einzelfall kam es jedoch in den letzten Versionen immer wieder zu deutlichen Veränderungen der Laufzeiten auf einzelnen Plattformen. So läuft in unseren Tests das Stacking von Farbkorrekturnodes am PC seit einiger Zeit deutlich langsamer, als in früheren Versionen.

Preis-Leistung

Erstklassige "Windows-CPUs" mit vergleichbarer ULTRA CPU-Performance (AMD Ryzen 9 5950X oder Intels Core i9-12900K) sind aktuell unter 600 Euro zu haben und Nvidias RTX 3090 Modell geht ebenfalls wieder deutlich unter 2.000 Euro über den Ladentisch. Rechnet man noch großzügig 1000 Euro für Speicher Netzteil, Gehäuse und Mainboard hinzu, so landet man bei 3500 Euro für eine Workstation, die ungefähr die doppelte Resolve-Performance eines voll ausgebauten Mac Ultra mit 64 GPU-Kernen liefern sollte.

Aussichten

Mehr als die Ultra Version des M1 dürfte Apple kaum über eine Interposer-Verbindung hinbekommen. Auf den aktuellen Dies ist zudem nur eine Kante mit Interposer-Anschlüssen bekannt, weshalb es höchst unwahrscheinlich ist, dass Apple diesen Weg für eine weitere Leistungsverdoppelung beschreiten kann. Der große Mac Pro mit Apple Silicon wird darum sehr wahrscheinlich mit einer Art Dual- oder Quad-Processing Technik arbeiten. Also zwei oder vier Ultra-Prozessoren, die über einen Bus kommunizieren. Dies könnte für das Betriebssystem aus dem eigenen Hause immer noch wie ein einziger Prozessor dargestellt werden, jedoch dürften hierbei die Skalierungsverluste größer ausfallen als bei der jetzigen Interposer-Lösung des Ultra Chips.

Die Skalierung über Interposer wird beim M1 schwer weiter skalierbar sein.

Nvidia wird dagegen die RTX 4090 noch dieses Jahr vorstellen und es ist zu erwarten, dass diese bei der Rechenleistung nochmal stark zulegen wird. Der Stromverbrauch wird sich nach ersten Gerüchten beim Topmodell fast verdoppeln, und das war in der Vergangenheit bei Nividia meist auch mit einer Verdoppelung der Leistungsfähigkeit einhergegangen. Die Gerüchteküche erwartet, dass das Topmodell RTX 4090 um die 80 TFlops (FP32) leisten wird. Um diese Leistung auf Basis des M1 zu erzielen, müsste Apple den Ultra Prozessor noch einmal "vervierfachen" (und das bei hunderprozentig skalierbarer Leistung). So sind zwar vier "Sockel" für einen MacPro denkbar, jedoch dürfte dies nach Apples Preisgestaltung dann auch einen Rechnerpreis von 20.000 Dollar im performantesten Ausbau bedeuten.

Die RTX4090 dürfte dagegen nach bisheriger Nvidia Preisgestaltung kaum über 2500 Dollar UVP kosten. Hiermit sollte sich im späten Herbst dann eine extreme Workstation unter 5000 Euro verwirklichen lassen, die (gepaart mit Intels und AMDs kommender DDR5-CPU-Generation) Apples Studio Varianten allesamt alt aussehen lassen wird. Allerdings auch bei einem Stromverbrauch von fast einem Kilowatt! Vier Mac Ultra Kerne sollten dagegen auch bei voller Auslastung noch um die 600W agieren.

Fazit

Der Mac Ultra bietet sicherlich die Leistung einer Workstation, agiert aber in den meisten Anwendungen sicherlich nicht auf dem Niveau eines Thread Rippers mit einer RTX 3090. Im Videoschnittbereich dürfte die Performance jedoch für die meisten Anwendungsfälle mehr als locker ausreichen, zumal aufgrund des üppigen Hardware-Codec-Ausbaus ein flüssiger Multitrack-Schnitt in zahlreichen relevanten Formaten möglich ist. Ob die eingebauten KI-Kerne in der Zukunft noch für performante KI-Effekte sorgen können, kann man dagegen heute noch nicht absehen. Es ist jedoch zu vermuten, dass das Feld der Künstlichen Intelligenz von Apple als ziemlich relevant eingestuft und entsprechend unterstützt wird.

Geht es um die reine Rechenleistung kommt man unter Windows nach wie vor weitaus günstiger weg - allerdings auch klobiger und lauter. Das war eigentlich schon immer so, nur dass momentan zudem der Stromverbrauch im Vergleich signifikant höher ausfällt.

Mac Studio mit M1 Ultra - Volle Workstation-Performance? : Header m1 ultra

Leserkommentare // Neueste

[34 Leserkommentare] [Kommentar schreiben]

TheBubble // 11:07 am 6.5.2022

Nur ein wenig Rauschunterdrückung? Sozusagen also nur etwas, das beliebig viel Rechenleistung verbrauchen kann? Dafür keine leistungsbeinträchtigenden Farbeffekte? Ab hier...weiterlesen

freezer // 10:52 am 6.5.2022

Eben drüber gestolpert... Da ist jemand offenbar nicht ganz so happy mit seinem "Studio" Kauf... Diesmal kein Windows Wechsler oder typischer Apple Hater sondern durchaus ein dem...weiterlesen

Axel // 05:36 am 6.5.2022

Eben drüber gestolpert... Da ist jemand offenbar nicht ganz so happy mit seinem "Studio" Kauf.... https://mobil.macwelt.de/pr... ... 27829.html (…) Wahrscheinlich ist der M1...weiterlesen

Im Forum mitdiskutieren >>

Wie wird ein Rechner schnell? Wichtige Hardware-Komponenten für die Videobearbeitung

Wer ernsthaft Videos bearbeitet, will möglichst viel Echtzeitperformance zum besten Preis. Doch worauf soll man bei der Hardware-Anschaffung achten? Wir werfen Licht auf die ...

// 16:07 Di, 6. Aug 2024von Rudi Schmidts

Meinung

Unified Memory für PC? Neue Prozessoren auf der CES 2024 - Verschlafene Chancen im PC-Sektor

Der PC-Branche geht es zwar wieder etwas besser und die zuletzt übervollen Lager sind deutlich abgeschwollen. Dennoch vermissten wir zur diesjährigen CES etwas frischen Wind im ...

// 13:31 Fr, 19. Jan 2024von Rudi Schmidts

Test

MacBook Pro Alternative? Asus Laptop ProArt P16 - Mobile Windows-Workstation im Resolve-Test

Auch unter Windows-Anwendern gibt es den Wunsch, mobil schneiden zu können. Doch wie viel Resolve-Performance lässt sich mit dem neuen Asus ProArt P16 in der Praxis abrufen?

// 11:11 Di, 24. Sep 2024von Rudi Schmidts

Test

Lenovo Yoga Pro 9i 16IRP8 - DaVinci Resolve Performance mit mobiler RTX 4070

Ein kompakter Laptop mit dedizierter Nvidia GPU sollte für den mobilen Schnitt unter DaVinci Resolve immer eine gute Wahl sein. Doch leider hat Nvidia bei seiner mobilen RTX 4070 ...

// 10:30 Di, 31. Okt 2023von Rudi Schmidts

Test

High-End im Miniformat Apple Mac Studio mit M3 Ultra im 4K-12K Performancetest mit ARRI, Sony, Canon, Blackmagic ...

Wir haben uns den aktuellen Apple Mac Studio im beeindruckenden M3 Ultra Maximalausbau angeschaut und wollten wissen, wie er sich im Schnittbetrieb mit anspruchsvollem 4K-12K ...

// 12:49 Di, 1. Apr 2025von Rob

Aktuelles

Neuer M2 Ultra in Mac Studio und Mac Pro mit PCIe - doch wofür?

Endlich gibt es einen neuen Mac Pro, der jedoch nicht schneller ist als der ebenfalls neue Mac Studio mit M2 Ultra Prozessor. Für viel Aufpreis gibt es sieben PCIe-Slots, deren ...

// 13:40 Di, 6. Jun 2023von Rudi Schmidts

Test

Stresstest Apple M4 Max im Macbook Pro 14 - Performance-Betrachtungen unter DaVinci Resolve

Der neue M4 Max ist wieder mal schneller als seine Vorgänger - doch bleibt er auch ein "heißer" Tipp für Resolve-Anwender?

// 10:37 Di, 17. Dez 2024von Rudi Schmidts

Test

MacBook Pro 16“ M2 Max im Performance-Test mit ARRI, Canon, Sony, Panasonic, Blackmagic …

Mit dem neuen M2 Max Prozessor stell Apple seinen bislang leistungsstärksten Notebook-Prozessor vor. Mit jetzt 12 CPU- und 38 GPU-Kernen tritt Apples aktuellstes Unified Memory-...

// 12:19 Fr, 27. Jan 2023von Rob

Test

slashCam Bestenliste Die besten DSLMs für Video 2025: Blackmagic, Sony, Nikon, Canon, Panasonic ...

Mit der Sony FX2, der Canon EOS R5 Mark II sowie der Panasonic S1II, S1RII und GH7 haben wir zahlreiche neue Kameras getestet, die viel Bewegung in unser "Beste DSLM für Video" ...

// 12:34 Mo, 11. Aug 2025von Rob

zur Artikelübersicht >

Das Ende der RAW WARS Blackmagic unterstützt Apple ProRes RAW - nicht nur in Resolve

Dass es irgendwann so kommen musste, war ja fast klar, aber zwei Tage VOR dem Beginn der IBC lässt Blackmagic ziemlich überraschend eine fette Katze aus dem Sack: Das neueste ...

// 09:58 Mi, 10. Sep 2025von Rudi Schmidts

News

Profi-Videofeatures iPhone 17 Pro: ProRes RAW, Genlock, Apple Log 2 und Blackmagic ProDock für Filmer

Apple hat mit dem iPhone 17 Pro und iPhone 17 Pro Max die neueste Generation seiner Pro-iPhone Modelle vorgestellt, die Verbesserungen in den Bereichen Rechenleistung, ...

// 00:30 Mi, 10. Sep 2025von Thomas Richter

News

Direkter FX3 Konkurrent Canon Cinema EOS C50 - Vollformat kompakt mit 7K60p Open Gate RAW Aufzeichnung

Canon ergänzt seine Cinema EOS Reihe um die neue EOS C50. Als bisher kleinste Kamera der Cinema EOS Serie soll sie mit kompakter Bauform und professionellen Funktionen glänzen. ...

// 14:59 Di, 9. Sep 2025von Rudi Schmidts

Test

Neue kompakte Cine-Referenz? Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?

Mit der Nikon ZR präsentiert Nikon die heiß erwartete, erste Version seiner RED RAW Implementierung in einem kompakten Nikon-Vollformat Body. Mit einer UVP von 2.349,- Euro bei 6K ...

// 05:58 Mi, 10. Sep 2025von Rob

TOP THEMEN //

MEHR ARTIKEL

zur Artikelübersicht >

PASSENDE DISKUSSIONEN

zum Forum >>

Aktuelle News //

News

Funkmikro-Deals RØDE senkt Preise für seine RØDE Wireless Mikrofonsysteme radikal

RØDE hat erhebliche Preissenkungen von bis zu 38% für seine drahtlosen Mikrofonsysteme RØDE Wireless Micro, GO (Gen 3) und PRO angekündigt, durch die die Mikrofone samt ...

// 16:02 So, 14. Sep 2025von Thomas Richter

News

Erste Mittelformat-Cinecam Fujifilm GFX Eterna 55 erklärt: Aufnahmeformate, Großformat-Open-Gate, Fujinon 32-90

Fujifilm präsentiert auf der IBC 2025 seine erste Kinokamera. Intern basiert die Fujifilm GFX Eterna 55 auf der GMX100 II, bietet jedoch mehrere Verbesserungen wie OLPF und ND – .....

// 12:08 So, 14. Sep 2025von Thomas Richter

zur Newsübersicht >

zum Forum >>

Neueste Artikel //

Test

Neue kompakte Cine-Referenz? Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?

Mit der Nikon ZR präsentiert Nikon die heiß erwartete, erste Version seiner RED RAW Implementierung in einem kompakten Nikon-Vollformat Body. Mit einer UVP von 2.349,- Euro bei 6K ...

// 05:58 Mi, 10. Sep 2025von Rob

Praxis

Maskieren mit KI DaVinci Resolve 20 Workshop - Mit der Magic Mask v2 Objekte automatisch freistellen

Mit Resolve 20 hat die Studio Version auch eine neue Version v2 der Magic Mask erhalten. Unser kleiner Workshop erklärt, wie sie funktioniert und was sich in der Bedienung ...

// 13:49 Mo, 1. Sep 2025von Rudi Schmidts

zur Artikelübersicht >