Sollten 8K-Kameras nun schon bald bezahlbar werden wollen die erzeugten Pixelmassen natürlich auch bearbeitet werden. Schon alleine aus diesem Grund müssten Prozessoren, Grafikkarten und Speicherbusse mal eben ein weiteres mal um das vierfache an Performance zulegen um eine vergleichbare Performance wie bei 4K zu erzielen.
Mit Tricks (s.u.) wäre dies sogar denkbar, doch das Gros wichtiger Effekte wie Slow-Motion oder Denoising laufen auch heute noch auf den wenigsten Systemen bei 4K-Auflösung in Echtzeit.
Folgende gravierenden Neuigkeiten stehen in in den nächsten Wochen und Monaten bei der GPU-Entwicklung ins Haus:
Allen voran wird die Chipdichte durch neue Herstellungsprozesse das erste mal seit über 4 Jahren wieder signifikant erhöht. Dies ermöglicht nicht nur Chips mit weniger Stromverbrauch, sondern bei gleicher Chipfläche auch mehr Leistung durch mehr Rechneneinheiten. Da alle Hersteller den erwarteten 20 nm-Prozess vor 2 Jahren ausgelassen haben, dürfte die Leistungssteigerung durch diesen Shrink von 28nm auf 16/14nm deutlich stärker ausfallen als bei allen früheren Generationswechseln.
Neues bei Nvidia
Bei Nvidia wird man nur beim absoluten Top-Modell mit GP100-Grafikkern in den Genuss von (mindestens) 16 GB gestapeltem und direkt angebundenen HBM2-Speicher kommen. Doch wie es aussieht bleibt dieses Top-Modell erst einmal dem KI/Wissenschaftsbereich zu extremen Preisen bis mindestens Ende des Jahres vorbehalten. Nvidia verkauft sogar einen eigenen Super-Computer für Deep Learning, der mit 8 GP100-GPUs ca. 125.000 Euro kostet und sagenhafte 80 fp32 TFlops liefert. Außer dem Preis sollte dabei nichts dagegen sprechen, dieses System auch für Resolve unter Linux zu nutzen.
Für normalsterbliche wird es jedoch zunächst einmal (ab Juni) Nachfolger mit GDDR5(X) für die GTX970/980 (und Ti?) geben, die nun GTX 1070/80 heißen sollen. Die neuen Karten basieren auf dem GP104-Chip und die große GTX1080 wird wahrscheinlich in der Preislage um die 600 Euro mit 8GB GDDR5X-Speicher ausgeliefert werden (320 GByte/s) und sollte um die 6 TFlops liefern. Die kleinere GTX 1070 dürfte dagegen ca. 300-400 Euro kosten. Dass hier wieder eine Art Speichercrippeling stattfindet ist nach dem PR-GAU der GTX 970 wohl nicht zu erwarten. Stattdessen soll das kleinere Modell ebenfalls 8 GB Speicher bekommen, aber nur DDR5 ohne X, welches dann noch 256 GB/s schafft. Dazu dürften bei der GTX1070 ein paar Shader weniger aktiviert sein, weshalb man hier eine Leistung zwischen 4,5 und 5 TFlops erwarten darf.
AMD
Dem wird AMD gerüchteweise eine frische R9 470/480/490(X)-Plattform entgegensetzen, die ebenfalls mit GDDR5(x) auf den neuen Polaris Chips basieren werden. Wie auch bei Nvidia bleibt die Top-Performance Fury-Serie bis 2017 unverändert, weshalb nun erst einmal die Mainstream-Karten von den neuen Fertigungsprozessen profitieren dürfen. So werden sich unter diesen neuen Karten sicherlich einige 8GB Karten mit 5-6 TFlops um die 300 Euro befinden. Diese werden jedoch deutlich weniger Strom verbrauchen (110 -130W) als die aktuelle Generation (ca. 200W). Dazu wird nun endlich auch ein HDMI 2.0-Anschluss für 4K mit 60Hz vorhanden sein. Und auch die 10 Bit-Ausgabe soll bei allen neuen Grafikkarten freigeschaltet sein. Und vielleicht bekommt man hier nun auch noch interessante, kompaktere Formfaktoren (alá Nano) zu Gesicht.
Neue GPU-Trends
Doch die extremsten Neuerungen spielen sich gerade bei Nvidia und der kommenden GP100-GPU ab, die jedoch frühestens Weihnachten 2016 als Titan-Nachfolger für Consumer erhältlich sein wird. Schon ab Sommer 2016 soll man diesen Chip jedoch als Tesla P100 erwerben können.
Ein potentieller Killerbeschleuniger (der vielleicht auch in den neuen GTX1070/80 zur Verfügung steht) ist dabei die Half-Float-Unterstützung. Einfach erklärt, handelt es sich hierbei um Fließkomma-Zahlen mit halber Genauigkeit, was für typische Videoanwendungen (und selbst hochqualitative Farbkorrektur) in 98 Prozent aller Fälle immer noch völlig ausreichend sein dürfte. Diese FP16-Register können im Vergleich zu FP32-Registern doppelt so schnell bearbeitet werden. Und sie benötigen auch nur den halben Speicherplatz, bzw. stehen auch doppelt so schnell zur Verfügung. Sollten Applikationen wie Resolve optional (evtl auch nur zur Vorschau) auf FP16 umschaltbar sein, erhöht sich deren Rechenperfomance ohne Auflösungsverlust drastisch. Ein solcher FP16 Modus wäre wie ein Schalter der die CUDA-Kerne und die Speicheranbindung verdoppelt. Doch es bleibt abzuwarten, ob sich Video-Applikations-Entwickler gleich an diese Funktionalität herantrauen.
Eine weitere extreme Neuerung ist die Vernetzung einzelner GPUs per NVLINK. Hierbei können einzelne GPUs in einem Rechner abseits von PCIe sehr schnell Daten austauschen. Konkret mit 80-200 GB/s, während PCIe 3.0 im besten Fall 16 GB/s schafft. Dies macht die Skalierung mehrerer GPUs in einem System deutlich effektiver. (Allerdings wird es nach aktueller Aussicht im Consumerbereich keine NVLINK fähigen Grafikkarten geben.)
Nicht zuletzt wird Nvidia seine kommenden Top-Modelle mit 16 GB HBM2-Speicher ausliefern, wodurch auch aufwändigste 4K-Effektkombinationen genug Speicher haben dürfen, der dazu extrem schnelle Zugriffszeiten bietet.
AMD wird sicherlich dem einen oder anderen Feature folgen (vor allem FP16 scheint uns extrem effizient und Intel kann es auch schon). Sollten dann auch die Applikationen nachziehen, dürften auch aufwändige 4K-Echtzeiteffekte Ende 2016 keine Besonderheit mehr sein.