Nachdem sich erfreulicherweise unsere Dynamik-Tests (ja, wir nennen sie weiterhin so) in letzter Zeit größerer Diskussionen erfreuen, bleiben wir dabei ebenso erfreulicherweise nicht von Kritik verschont. Anstatt nun im Forum auf die einzelnen Anregungen und Kritikpunkte separat einzugehen, schreiben wir lieber gleich einen entsprechenden Artikel, auf den wir in Zukunft gerne verlinken. Denn neu sind die aktuell geführten Diskussionen nicht...
Sollte der Dynamik Test nicht eher Latitude-Test heißen?
Für diesen Vorschlag muss man wohl am besten zuerst die Begriffe klären, denn sonst wird jede Diskussion müßig. Vielleicht schauen wir uns darum erst einmal eine Grafik von Arri an. Diese stellt das dar, was man gemeinhin unter Exposure Latitude versteht und was man wohl treffend mit Belichtungsspielraum übersetzt:

Wir sehen im Bild vier Parameter, die für den Belichtungsspielraum wichtig sind: Einmal den Exposure Index, der nur eine Metadaten-Variable ist. Diese kann man nicht messen. Sie besagt nur, wie wir die anderen drei Parameter in der Postproduktion interpretieren sollten.
Des weiteren haben wir einen 18 Prozent Grauwert, sowie eine Dynamikangabe in Blendenstufen (Stops) darunter (in den Schatten) und eine Dynamikangabe darüber (in den Lichtern). Die drei Werte im Zusammenspiel bezeichnet man gemeinhin als Belichtungsspielraum oder englisch Latitude.
Mit der Dynamik einer Kamera bezeichnet man dagegen die addierten zwei Blendenstufenangaben des Belichtungs-Spielraums. Also beispielsweise im Bild bei EI200 entsprechen 5,6 + 8,9 Stops einer Dynamik von 14,5 Blendenstufen.
Wir wollten bei unserem Test ohne Grauwert auskommen und nennen ihn deswegen bewusst "Dynamik Test".
Warum kein Mittelgrau?
Wenn wir eine 18% Graukarte ins Bild halten, können wir theoretisch bestimmen, wo der Wert in der Aufnahme landet. Jedoch ist dies abhängig davon, welches Bild- oder Log-Profil in der Kamera eingestellt ist. Und davon ist wiederum abhängig, wie viele Blenden der gesamten Dynamik dem Bild über dem Mittelgrau zugewiesen werden und wie viele man darunter fallen lässt. Wenn ich meinen Grauwert tiefer ansetze, bekommt man (mit einem entsprechenden Bildprofil) z.B. ein sanften Highlight Rolloff.
Eine Graukarte, die nicht selbst leuchtet, besitzt natürlich nie eine feste Helligkeit "per se", sondern ist vom Kontext des Gesamtmotivs abhängig. D.h. wie viel Licht letztlich auf die Stelle der Graukarte fällt, wo man sie eben hinhält.
Und das bedeutet letztlich: Das Motiv bestimmt maßgeblich den Blichtsspielraum. Also zumindest wo der Graupunkt im Verhältnis zu den restlichen Objekten im Bild sitzt. Zusätzlich bestimmt man bei einer RAW/Log-Aufzeichnung aber den Graupunkt auch noch nachträglich in der Post.
Und das bedeutet für einen Messaufbau viele zusätzliche Variablen, die einer Vergleichbarkeit grundsätzlich schlecht tun. Denn man müsste in diesem Fall den Test idealerweise immer mit vielen diversen Bildprofilen durchführen, was eine Fülle von Ergebnissen pro Kamera erzeugt. Das will man sich jedoch weder selbst antun, noch will das kaum jemand sehen oder lesen.
Wir für uns haben daher seinerzeit beschlossen: Was uns einzig interessiert, ist die Länge des gesamten Balkens in der Grafik. Und das ist nun mal die Dynamik.
Aber wäre nicht XX trotzdem besser/interessanter?
Schon diese Dynamik zuverlässig und vergleichbar einzufangen ist aufwändiger, als es später in unseren Vergleichsvideos aussieht und ja, natürlich könnte man alles noch viel besser und fancier machen, aber wir mussten es schließlich auch praktikabel halten und an einem Punkt loslegen, damit irgendwann mal eine relevante Masse an Vergleichskameras zusammen kommt. Und das ist der Punkt, an dem wir jetzt sind. Was ihr heute in einem Artikel als Vergleichsergebnis seht, hatte ca. 2 Jahre Vorarbeit mit diversen Testreihen und basiert trotzdem auf vielen Kompromissen. Und es ist eben nur eine Möglichkeit von sehr vielen, die Vergleichbarkeit der Dynamik herauszuarbeiten. Aber eben die, die wir jetzt seit zwei Jahren verfolgen.
Etwas an der Methodik zu verändern, hieße wieder ganz von vorne bei Null anzufangen. Da uns jedoch die Ergebnisse persönlich sehr gut helfen, die Dynamikfähigkeiten der Kameras einzuschätzen, bleibt es jetzt erstmal dabei. Wenn wir sehen, dass die Ergebnisse nicht mehr relevant sind, dann ändern wir das ganze wahrscheinlich wieder (oder lassen es ganz;).
Was ihr zeigt hat keine Relevanz
"Die Unterschiede, die ihr für die Dynamik herausgearbeitet habt, haben keine Relevanz." oder "Kein Mensch macht eine Unterbelichtung über 3 Blendenstufen, zeigt lieber ganze Bilder mit hoch dynamischem Bildinhalt".
Klingt nachvollziehbar? Ist es aber nach unserer Erfahrung nicht. Wenn man hochdynamische RAW-Bilder mit einer ARRI oder C70 aufzeichnet und diese anschließend ausspielt - was bekommt man dann auf seinem Computermonitor zu sehen? Eine eher willkürlich auf 8 Bit zusammengepresste Dynamik. Kann sehr gut sein, dass ihr dann bei Kamera A mehr Details in den Schatten seht als bei Kamera B, oder die eine Kamera einen weicheren Rolloff hat als die andere, aber das liegt dann zu 95 Prozent nicht an den Dynamikeigenschaften der Kamera, sondern an den Bildprofilen und Gammakurven in der gesamten Bildverarbeitungskette bis zu eurem Monitor am Internet.
Was wir dagegen versuchen, mit unserem Testaufbau vergleichbar zu zeigen, ist: Welche Reserven bietet eine Kamera? Und (nicht nur) wir vertreten die schlichte Meinung: Je mehr Reserven, desto besser das Bild der Kamera. Und ja, das ist auch ziemlich relevant, sobald man in der Post nachkorrigiert. Denn je mehr Reserven, desto unauffälliger gelingt die Korrektur.
Aber was nützt mir eine hohe Dynamik, wenn die Farbkonstanz nicht stimmt?
Das typische Argument lautet hier: "Der Hersteller optimiert seine Sensorfarben, sodass beispielsweise die Hauttöne in einem definierten Helligkeitsbereich am besten aussehen. Wenn ich ETTR filme, bekomme ich doch Farbverschiebungen."
Abgesehen davon, dass dies eine komplett andere Diskussion ist (die ebenfalls schon oft bei uns geführt wurde), darf dieses Argument für RAW-/und Log-Kameras eigentlich nicht stimmen. Denn der Witz an RAW und Log-Farbräumen ist ja gerade, dass man sich seinen Graupunkt durch den Exposure Index oder eine nachträgliche ISO Einstellung selbst wählen kann (siehe nochmal Bild 1 oben).
Damit können die Hauttöne aus fast allen Empfindlichkeitsbereichen das Sensors stammen. Und eben genau deswegen stecken alle namhaften Hersteller viel Zeit und Geld in Log-Profile, die dafür sorgen sollen, dass die Farben auch bei Änderung des Exposure Indexes konstant bleiben. Oder bei einer ISO-Korrektur in der RAW-Entwicklung. Sollten dagegen die Farben tatsächlich durch eine solche Verschiebung stark divergieren, fällt dies in der Regel auch bei unseren Test-Clips schnell "ins Auge".
Nicht zuletzt sind unsere Tests kein Aufruf, mit ETTR und/oder mit Exposure Index zu filmen. Diese Einstellungen sind nur pragmatische Hilfsmittel, um die Dynamikgrenzen einer Kamera vergleichbar zu machen. Wie gesagt, wir wollen damit nur die Reserven des Sensors zeigen. Und keine schönen Augen.
Warum nehmt ihr dann kein Xyla-Chart?
Weil es eben etwas anderes ist, ob man aus dem Rauschen einen grauen Kasten "retten" muss oder ein sehr feines Motiv wie ein Auge mit Wimpern. Ersteres gelingt einer integrierten Noise Reduktion in der Kamera meistens problemlos, zweiteres zeigt tatsächlich die Grenzen, was von einem realen Motiv in den Schatten noch übrig bleibt.
Aber wenn man mit Noise Reduction testet,....
... "dann ist die Vergleichbarkeit doch auch dahin."
Ja, das würde stimmen, aber es ist nicht so, dass wir jetzt ausschließlich mit Noise Reduction testen. Wir haben nur in zwei Sonderfällen in Artikeln die Noise Reduction mit ins Spiel genommen, um anschaulich zu zeigen, wie stark diese letztlich die Dynamik beeinflusst. (Und zwar weitaus mehr als fast alle anderen einzelnen Faktoren der Dynamik.)
Wir denken aber selber, dass man dies eigentlich nur bei einem bewegten Motiv vergleichen sollte, wobei es wiederum schwer ist, exakt eine schwer vorauszusagende, quasi randomisierte Bewegung mit verschiedenen Kameras reproduzierbar aufzuzeichnen. Darum haben wir auch bewusst geschrieben:
"Dazu sei gleich vorneweg kritisch angemerkt, dass eine Noise Reduction auf ein stehendes Motiv natürlich mit einer großen Prise Skepsis bezüglich der Praxisrelevanz zu behandeln ist. Vielmehr sollte man das Ganze eher als eine "Ausreizung des maximal Möglichen im Best Case" verstehen."
Doch auch das ist eigentlich schon wieder ein anderes Thema...
