In den letzten Jahren hat bei der Technologie für Videobearbeitungsprogramme ein Paradigmenwechsel stattgefunden. Nicht mehr der Hauptprozessor sondern die Grafikkarte wird für die Berechnung vieler Effekte benutzt. Dies hat zur Folge, dass man bei der Zusammenstellung seines Schnittrechners auf diese Komponente besonderen Wert legen sollte. Wir haben uns exemplarisch einmal ein paar repräsentative Grafikkarten näher angesehen.
Für die Videobearbeitung in 4K-Auflösung kann an Leistung einiges zusammenkommen. Der Hauptprozessor (kurz CPU) wird im optimalen Fall nur noch zum Decoding der Videoströme benötigt. Die meisten relevanten Effekte über nimmt dann die Grafikkarte (kurz GPU). Die Leistung einer GPU lässt sich grob in so genannten TerraFLOPS ausdrücken. Diese Zahl beschreibt, wie viel Rechnenschritte eine GPU im optimalen Fall pro Sekunde ausführen kann.
Moderne Consumer-CPUs von AMD oder Intel kommen oft ebenfalls mit einer integrierten GPU-Einheit, deren Rechenleistung bislang immer noch unter der 1 TFLOPS Grenze bleibt. Für ein 4K-Schnittsystem würden wir als minimale Untergrenze 2-3 TFLOPS ansetzen. Diese Rechenleistung erbringen momentan nur separate Grafikchips von Nvidia oder AMD.
Es gibt diese Chips in praktisch allen Leistungsklassen, wobei Topmodelle mit einer GPU mittlerweile bis zu 8 TFLOPS erzielen. Sogenannte Dual-GPU Karten können sogar 15 TFLOPS oder mehr erreichen. Bei diesen Modellen sitzen zwei GPU-Chips auf einer Platine. Alternativ kann man jedoch auch zwei einzelne Grafikkarten in einen Rechner stecken und so ebenfalls die “Kraft der zwei Herzen” nutzen.
Lassen es Rechnergehäuse, Netzteil, Mainboard und Applikation zu, so können sogar bis zu drei GPUs ein Programm ohne größeren Hardwareaufwand beschleunigen, jedoch ist eine solche Konfiguration nach unserer Erfahrung nur mit der Vollversion von DaVinci Studio sinnvoll auszunutzen. Die TFLOPS sind übrigens nur ein grober Anhaltspunkt für die Geschwindigkeit in DaVinci Resolve, weil sich die Implementierung der Effekte stark in der Praxis unterscheidet. Die Schwankungsbreite kann man übrigens schön in unserer Testtabelle sehen.
Vielleicht auch noch ein Wort zu den Ressourcen: Als Mindestspeicher empfehlen wir für die 4K Bearbeitung 4GB RAM für jeden GPU-Prozessor. Diese Speichermenge haben wir Premiere noch niemals voll ausnutzen gesehen. DaVinci Resolve verlangt bei sehr komplexen Projekten dagegen gelegentlich auch 6GB oder mehr, wenn noch das Debayering sowie diverse GPU-Plugins “mitlaufen” sollen. Gleichzeitig sollte der Speicher mit mindestens 256 Bit an die GPU angebunden sein. Nicht nur um einen schnellen Datentransfer zwischen GPU und CPU zu ermöglichen, sondern vor allem um bei der Berechnung von komplexen Effekten schnellen Speicherzugriff zu haben. Dies ist besonders bei GPU-Effekten wichtig, die von vielen Nachbarpixeln beeinflusst werden.
Entsprechende 4GB-Karten mit 256 Speicherbus sind bei AMD ab ca.180 Euro zu haben (Radeon R7 370), bei Nvidia beginnt der Spaß aktuell bei ca. 320 Euro mit der GTX 970.
Wir haben uns jedoch für für diesen Test noch eine Klasse darüber umgesehen. Mit Karten wie der AMD R9 290/390X, den Fury Modellen oder Nvidias 980 Ti hat man in der Regel genügend Reserven für ausgefallenere Projekte. Außerdem dürfte deren Leistung auch im nächsten Jahr noch genügend Leistungsreserven für kommende Programmversionen und Effekte bieten.
Sapphire Tri-X R9 Fury
AMD verkauft mit den Fury-GPUs erst seit kurzem seine aktuelle Flagschiff-Technologie. Das besondere daran sind die besonders schnell angebundenen Speicherchips. Den Geschwindigkeits-Vorteil bekommt man jedoch in Resolve und Premiere kaum zu spüren. Auch preislich sind die Fury-Karten für AMD-Verhältnisse eher teuer. Dazu ist der maximale Speicherausbau momentan auf 4GB limitiert.
Im normalen Betrieb war die Grafikarte bemerkenwert leise, sobald sie jedoch in Resolve richtig gefordert wurde, gab sie einen deutlich vernehmbaren Ratter-Knatter-Mix von sich. In der Performance schlug sich unsere Sapphire Tri-X R9 Fury mit den Top-Grafikkarten von Nvidia (Titan X/ 980Ti) auf Augenhöhe. Die Karte kostet jedoch im Handel noch etwas über 600 Euro und ist damit nicht signifikant billiger als eine Nvidia 980Ti (ca. ab 650 Euro), die nicht nur leiser zu Werke geht, sonder auch noch mehr Speicher bietet (6GB).
Die Performance der Sapphire Tri-X R9 Fury ist unter Resolve beeindruckend und erreicht als Single GPU schon die Geschwindigkeit eines aktuellen Mac Pro mit maximalem DUAL-GPU-Ausbau (2 x D700 6GB) . In manchen Effekten kann jedoch auch eine einzelne 980Ti die Fury ein- oder sogar überholen. Insgesamt gesehen liegen die beiden Top-Modelle beider Hersteller hier ungefähr gleichauf.
Besonders interessant dürfte die Radeon R9 Nano werden, die auf der gleichen Fury Technologie basiert, jedoch deutlich weniger Strom verbraucht, mindestens so schnell rechnet und dabei deutlich kompakter ausfällt. Mit nur 15cm Länge eignet sich diese Karte besonders für Dual oder Tripple-GPU-Setups,da man nicht mehr besonders üppig beim Rechnergehäuse oder beim Netzteil planen muss. Die Preise für die Nano beginnen allerdings aktuell bei ca. 680 Euro.
Dies führt uns zum Preis-Leistungs-Wunder in unserem Test:
Sapphire Tri-X R9 290X
Die Spitzenmodelle aus der AMD-Vorgängergeneration tragen den Namen R9 290(X) bzw. 390(X). Diese sind auch mit üppigen 8GB erhältlich und kosten (je nach Konfiguration) meist zwischen 300 und 450 Euro. Die Leistung unserer Testkarte Sapphire Tri-X R9 290X lag zwischen 5 bis 25 Prozent unter den aktuellen Topmodellen Fury/980Ti. Schon eine Karte reicht dabei eigentlich locker für die meisten 4K-Anwendungfälle aus. Eine 2x8GB Kombination ist mit diesen Karten schon für 800 Euro zu realisieren. Unsere exemplarischen Testmessungen mit zwei Sapphire Tri-X R9 290X ließen uns dann auch Messwerte sehen, die wir noch nie zuvor erlebt haben. Beispielsweise ruckelfreie 24p mit einer einfachen Temporalen Noise-Reduction in 4K.
Nachteil der Karten ist klar ihr hoher Stromverbrauch sowie das ausladende Gehäuse. Die Karten gaben dazu bei voller Auslastung auch leichte Geräusche von sich.
KFA2 GTX980Ti
Die Nvidia GTX980Ti ist mit 660 Euro Internetpreis wahrhaft kein Schnäppchen, liefert jedoch zuverlässige Leistung ohne Murren zum Nvidia-typischen Aufpreis. Nebenbei erwähnt auch ohne Surren, denn die 980Ti war die leiseste Karte in unserem Testfeld die selbst bei großer Auslastung in Resolve akustisch nicht sonderlich auffällig wurde. Im aktuellen Marktgefüge der Top-Modelle steht die Karte sogar gar nicht einmal auffällig teuer dar, denn sie bietet bei aktuell nur moderatem Aufpreis gegenüber den Fury-Modellen sogar 6 statt 4 GB Speicher und liefert mindestens eine vergleichbare Leistung in Resolve.
Aus dem Mittelfeld betrachtet, bekommt man allerdings mit zwei Radeon R9 390 8GB-Modellen (ohne X!) für einen ähnlichen Preis höchstwahrscheinlich deutlich mehr Leistung, die unserem DUAL R9 290X-Setup nur wenig nachstehen dürfte.
Nvidia GTX770 und Quadro K5200
Wir haben zum Vergleich auch noch zwei ältere Nvidia-Karten der Keppler-Generation mit dem neuen Resolve 12 ausgemessen. Es handelt sich hierbei um eine GTX770 mit 4GB sowie eine Nvidia Quadro K5200. Beide Modelle haben ähnliche Rahmendaten, einmal als Consumer- und einmal als Profi-Modell ausgelegt. Der enorme Aufpreis der Quadro K5200 resultiert dabei nicht aus ihrer Rechenleistung, sondern wird von Nvidia durch andere Faktoren erklärt. Dies ist einmal der größere Speicher (8GB), eine mögliche 10 Bit Ausgabe sowie ihre bessere Effizienz durch geringere Taktung. So benötigt die K5200 nur einen zusätzlichen 6 Pin-Stromanschluss, während die GTX770 einen 6 und einen 8 Pin Stecker verlangt.
Die Tabelle zeigt, wie sich die Leistung diverser Grafikkarten unter dem aktuellen DaVinci Resolve Studio 12 auswirkt. Getestet wurde auf einem Intel Core i7-5820K, 6x 3.90GHz
mit 16 GB Ram. Es wurden diverse GPU-intensive Effekte angelegt und gewmessen. Der erste Wert (Max Num Curved Nodes) beschreibt wie viele Farbkorrektur-Nodes auf einen 4K-Clip in Echtzeit angewendet werden können. Die anderen Werte beschreiben die Bildwiederholrate bei besonders komplexen Effekten. Echtzeit ist hier erreicht, wenn 24 fps ruckelfrei wiedergegeben werden können. Mehr als 24 (fps) kann eine GPU in unserem Test daher nicht erreichen, denn die Projekt-Wiedergabe ich hiermit schon optimal.
GPU | TFlops ca. | Preis ca. (Okt.2015) | Max Num Curved Nodes Full 24p Playback | Motion Blur Better, Large, 30.0 | Spatial NR, small, 50, 50 | Spatial NR, large, 100, 100 | Temp NR 1 Faster Small 50 50 50 | Temp NR 2 better large 50 50 50 |
---|---|---|---|---|---|---|---|---|
K5200 8GB | 3 | 1800 Euro | 7 | 7,25 | 11,5 | 4 | 13 | 6 |
GTX770 4GB | 3,5 | 330 Euro | 9 | 7,5 | 11 | 3,25 | 12,25 | 7 |
AMD R9 290X 8GB | 5,8 | 400 Euro | 22 | 9,75 | 23,5 | 7,5 | 15,5 | 7,5 |
980Ti 6GB | 5,6 | 650 Euro | 23 | 13 | 24 | 9 | 20,5 | 10,25 |
AMD Fury 4GB | 7 | 600 Euro | 29 | 12,25 | 24 | 9,5 | 18,5 | 9,5 |
Apple Mac Pro 2x D700 | 7 | 33 | 10 | 24 | 8,75 | 15,5 | 5 | |
GTX770 4MB K5200 8GB PCIe3x16 | 6,5 | 22 | 14,25 | 22,5 | 7 | 21 | 7 | |
K5200 x16 980Ti x8 | 8,6 | 25 | 15 | 24 | 8 | 23 | 7,5 | |
K5200 980Ti GTX 770 | 12 | 33 | 19,5 | 24 | 10 | 24 | 10,5 | |
2x AMD R9 290X 8GB | 12 | 44 | 18 | 24 | 15 | 24 | 9,5 |
Alle Benchmarks mit der neuen Version 12 DaVinci Resolve Studio
Alle Werte stellen die Wiedergabe in fps dar, bis auf "Max Num Curved Nodes" (= Anzahl der maximalen Nodes bei ruckelfreier 24p-Wiedergabe).
Adobe Premiere
Die Leistung der Karten unterscheidet sich im realen Einsatz weniger als die Zahlen vermuten lassen. Unter Adobes Premiere reicht in der Regel schon eine 4GB-Mittelklasse Karte aus, um mehrere 4K-Spuren mit typischen Effekten in Echtzeit wiederzugeben. Falls es bei mehreren Spuren ruckeln sollte, ist in der Regel der Prozessor der Flaschenhals. In diesem Test ist uns dazu aufgefallen, dass Premiere mittlerweile auch 2 Nvidia GPUs synchron ansprechen kann. Das war nicht immer so.

Der gleiche Test mit zwei AMD Karten ließ jedoch weiterhin eine Karte brach im System liegen. Vielleicht auch an dieser Stelle erwähnenswert: Es ist möglich unterschiedliche Grafikkartentypen des gleichen Herstellers zu kombinieren, jedoch kommt es hierbei meist zu einer nicht optimalen Verteilung der Ressourcen.
Eine der beiden Karten zieht in so einem Fall den kürzeren und wird meist nur teilweise ausgelastet. Das gilt auch für Resolve...
DaVinci Resolve Studio 12
Unter Resolve Studio 12 kommen die Unterschiede der Karten deutlich zum Vorschein, jedoch hat man auch hier davon auch selten einen realen Vorteil. Nutzt man die kostenlose Lite-Version, so befinden sich die rechenaufwendigen Spezialeffekte wie Motion Blur oder die Noise Reduction gar nicht im Lieferumfang. Außerdem unterstützt diese kostenlose Version auch nur eine GPU.
In der kostenpflichtigen Studio-Version liegt der Unterschied dann meistens darin, ob man seine Effekte mit 8 oder 16 Frames pro Sekunde ruckeln sieht. Relevant werden mehrere GPUs hier nur, wenn sie wirklich 24fps, also Echtzeit versprechen. Dies durften wir in immerhin mit zwei parallelen R9 290X im Fall einer moderat eingestellten temporalen Noise Reduction erleben. Umgekehrt haben wir jedoch auch erlebt, dass eine temporale Noise Reduction in den besten Einstellungen mit extremer GPU Leistung kaum schneller als 10 fps wird. Diese extremen Einstellungen wird man also bis auf weiteres also niemals in Echtzeit erleben können.
Bei der täglichen Arbeit bringt eine zusätzliche SSD als reiner Bilder-Speicher (aka Proxy-Cache) zum Backgroundrendering bei richtigem Einsatz mehr Performancegewinn als eine zusätzliche Grafikkarte. Alternativ lassen sich zum beschleunigten Arbeiten die Projekt-Einstellungen von 4K auf FullHD herunterschalten. Dann laufen die meisten Effekte auf einer potenten GPU sowieso in Echtzeit. Gerade was die Ergebnisse von Rauschunterdrückung oder Motion Blur angeht ist eine pixelnative Vorschau jedoch in der Regel sehr empfehlenswert, weshalb wir hierfür immer eine Vorschau in voller 4K-Auflösung empfehlen würden.
Fazit
Die größte Erkenntnis dieses Testdurchlaufs war für uns, dass auch die Consumer-AMD Karten sowohl unter Premiere wie auch Resolve (sogar im DUAL-Verbund) mittlerweile gut funktionieren. Aktuelle Nvidia Karten sind bis auf das gerade erst vorgestellte AMD-Topmodell Fury Nano jedoch deutlich sparsamer unterwegs, als die übrigen AMD Modelle. Das erfordert mehr Planung beim Systemausbau und eine üppige Stromversorgung. Umgekehrt bieten gerade die älteren AMD-GPUs vor den Fury-Modellen ein signifikant besseres Preis-Leistungverhältnis sowohl bezüglich Performance als auch hinsichtlich des Speicherausbaus von 8GB.