Frage von timelapse:Nabend
Das Meiste war mir bekannt, ein paar Infos jedoch nicht.
Wer sich mit dem Thema Codecs befasst, findet im Clip eine grobe Übersicht.
Antwort von timelapse:
Nachtrag:
Der Knabe spricht von "VBR is good, when there IS a lot of motion/movement" - Warum ist das so? (vielleicht stimmt"s auch nicht, was er so von sich gibt).
Antwort von dienstag_01:
Warum ist das so?!
Weil bei VBR die Datenrate flexibel an die Erfordernisse angepasst wird. Also bei wenig Bildänderung - geringe Datenrate, bei viel Bildänderung/Bewegung - viel Datenrate. Macht besonders viel Sinn im 2 Pass Verfahren, der erste Pass analysiert das Video erstmal komplett. und verteilt die Spitzen sinnvoll.
Eine (logische) Einschränkung gibt es allerdings: wenn genug Recourcen vorhanden sind, man also die Datenrate hoch genug ansetzen kann, bringt VBR keinen Vorteil. Es ist letzendlich ein Verfahren zum Optimieren der Bildqualität bei möglichst geringen Datenraten.
Antwort von timelapse:
Warum ist das so?!
Weil bei VBR die Datenrate flexibel an die Erfordernisse angepasst wird. Also bei wenig Bildänderung - geringe Datenrate, bei viel Bildänderung/Bewegung - viel Datenrate. Macht besonders viel Sinn im 2 Pass Verfahren, der erste Pass analysiert das Video erstmal komplett. und verteilt die Spitzen sinnvoll.
Eine (logische) Einschränkung gibt es allerdings: wenn genug Recourcen vorhanden sind, man also die Datenrate hoch genug ansetzen kann, bringt VBR keinen Vorteil. Es ist letzendlich ein Verfahren zum Optimieren der Bildqualität bei möglichst geringen Datenraten.
Klingt einleuchtend. Merke ich mir für die 500MB"s freien Uploads bei Vimeo.
Danke
Antwort von MLJ:
@Timelapse
Also, das Video lässt sich nicht starten, zumindest bei mir. Was VBR betrifft so hat das nichts mit "VBR is good, when there IS a lot of motion/movement" zutun. VBR komprimiert wesentlich effektiver als CBR und damit verbrauchen "ruhige" Scenen nicht so viel von der Bitrate wie schnelle Actionscenen.
Da geht die Bitrate dann rapide auf das Maximum, das gewählt wurde. Es ist übrigens ein grosser Trugschluss, das VBR für Audio genauso Effektiv ist. Wenn Audio und Video im VBR-Mode sind, laufen diese auseinander.
Lade mal ein Video mit VBR Audio und schau es dir auf der Timeline an. Es ist nicht annähernd so lang wie der Film. Ein Fehler und das ganze ist asynchron. Noch besser wird das ganze, wenn man im Player mal "spult", dann kommt das Audio erst so richtig aus dem Tritt. Bei Video wird gern die "Long-Gop" verwendet, d.h. alle 10 Sekunden ein Keyframe. Weitere Keyframes legt der Codec selbst an, wenn er einen Scenenwechsel erkennt. So richtig "konsumierbar" ist das aber nicht wenn man Vor- oder Rückwärts spulen will (PC und DVD/BluRay Player).
Grund: Damit die gewünschte Position im Film gezeigt werden kann, muss der Player zuerst die letzten 10 Sekunden erneut lesen um dann vom letzten gefunden Keyframe an die Position zu gehen, die man sucht. Und wenn man mal "schnell" zum Ende des Films gehen will, dann dauert das entsprechend.
Es gibt: (Auszug MPEG-4 Standards)
Film 24p
Short GOP (1 Keyframe every 1 Second = Every 24 Frames)
Medium GOP (1 Keyframe every 5 Seconds = Every 120 Frames)
Long GOP (1 Keyframe every 10 Seconds = Every 240 Frames)
PAL 25p
Short GOP (1 Keyframe every 1 Second = Every 25 Frames)
Medium GOP (1 Keyframe every 5 Seconds = Every 125 Frames)
Long GOP (1 Keyframe every 10 Seconds = Every 250 Frames)
NTSC 30p
Short GOP (1 Keyframe every 1 Second = Every 30 Frames)
Medium GOP (1 Keyframe every 5 Seconds = Every 150 Frames)
Long GOP (1 Keyframe every 10 Seconds = Every 300 Frames)
(GOP = Group of Pictures)
Dazwischen liegen die P-Frames und, sofern ausgewählt, zusätzlich die B-Frames. Mit den P und B Frames spart man den meisten Platz im Video, Keyframes sind die Vollbilder, aus denen der Codec die P und B Frames generiert. Liegen die Keyframes zu weit auseinander, dann summiert sich ein "Fehlerhaftes" Bild von einem P/B Frame zum nächsten, bis der nächste Keyframe kommt, und dann wird es "hässlich".
MPEG-1/2 verwenden sogar noch kürze Abstände der Keyframes. Als Standard hat sich GOP 15 verbreitet durchgesetzt. Das bedeutet das alle 15 Frames ein Keyframe gesetzt wird. Zwischen diesen 15 Frames liegen die P/B Frames.
Hintergrund: Bei PAL und NTSC ergeben sich aufgrund der eigenen Framerate mathematisch die besten Bedingungen. Bei 75 Frames mit PAL sind es 5 Keyframes. (5x15=75) Bei NTSC bereits 4 nach 60 Frames. (4x15=60)
Nur bei reinem Film (24 frames) wird GOP 12 bevorzugt. Innerhalb 24 Frames liegen dann bereits 2 Keyframes. Deswegen sehen MPEG-2 codierte Filme "manchmal" besser aus, als MPEG-4, kommt aber auf die Einstellungen an und den natürlich den Codec.
Eine weitere MPEG-1/2 Variante ist das "Manual Keyframe-Setting". Hier wird eine Long GOP verwendet und explizit ein Keyframe bei jedem Scenenwechsel manuell gesetzt und dann ausgegeben, im 2-Pass VBR. In diesem Modus werden auch die P und B Frames manuell bestimmt. Man arbeitet sich also Bild für Bild durch den ganzen Film.
Wird allerdings selten gemacht, da jeder "Scenechange" einzeln markiert werden muss. Das dauert dann entsprechend lang, man hat dafür aber das beste Ergebnis.
CBR bei MPEG-1/2 Video "lohnt" sich nur, wenn man die Bitrate entsprechend hochdreht (Live Capture) oder wenn es das Format erfordert (VCD/SVCD z.B.).
Ich empfinde MPEG-4 als eine wundervolle Segnung und Alternative, aber man muss sich mit dem Format wirklich viel mehr auseinandersetzen als mit den Vorgängern von MPEG-1/2.
Konnte ich damit deine Frage "Warum ist das so ?" beantworten ?
Beste Grüsse, Mickey Lee.
Antwort von timelapse:
@Timelapse
Also, das Video lässt sich nicht starten, zumindest bei mir. Was VBR betrifft so hat das nichts mit "VBR is good, when there IS a lot of motion/movement" zutun. VBR komprimiert wesentlich effektiver als CBR und damit verbrauchen "ruhige" Scenen nicht so viel von der Bitrate wie schnelle Actionscenen.
Da geht die Bitrate dann rapide auf das Maximum, das gewählt wurde. Es ist übrigens ein grosser Trugschluss, das VBR für Audio genauso Effektiv ist. Wenn Audio und Video im VBR-Mode sind, laufen diese auseinander.
Lade mal ein Video mit VBR Audio und schau es dir auf der Timeline an. Es ist nicht annähernd so lang wie der Film. Ein Fehler und das ganze ist asynchron. Noch besser wird das ganze, wenn man im Player mal "spult", dann kommt das Audio erst so richtig aus dem Tritt. Bei Video wird gern die "Long-Gop" verwendet, d.h. alle 10 Sekunden ein Keyframe. Weitere Keyframes legt der Codec selbst an, wenn er einen Scenenwechsel erkennt. So richtig "konsumierbar" ist das aber nicht wenn man Vor- oder Rückwärts spulen will (PC und DVD/BluRay Player).
Grund: Damit die gewünschte Position im Film gezeigt werden kann, muss der Player zuerst die letzten 10 Sekunden erneut lesen um dann vom letzten gefunden Keyframe an die Position zu gehen, die man sucht. Und wenn man mal "schnell" zum Ende des Films gehen will, dann dauert das entsprechend.
Es gibt: (Auszug MPEG-4 Standards)
Film 24p
Short GOP (1 Keyframe every 1 Second = Every 24 Frames)
Medium GOP (1 Keyframe every 5 Seconds = Every 120 Frames)
Long GOP (1 Keyframe every 10 Seconds = Every 240 Frames)
PAL 25p
Short GOP (1 Keyframe every 1 Second = Every 25 Frames)
Medium GOP (1 Keyframe every 5 Seconds = Every 125 Frames)
Long GOP (1 Keyframe every 10 Seconds = Every 250 Frames)
NTSC 30p
Short GOP (1 Keyframe every 1 Second = Every 30 Frames)
Medium GOP (1 Keyframe every 5 Seconds = Every 150 Frames)
Long GOP (1 Keyframe every 10 Seconds = Every 300 Frames)
(GOP = Group of Pictures)
Dazwischen liegen die P-Frames und, sofern ausgewählt, zusätzlich die B-Frames. Mit den P und B Frames spart man den meisten Platz im Video, Keyframes sind die Vollbilder, aus denen der Codec die P und B Frames generiert. Liegen die Keyframes zu weit auseinander, dann summiert sich ein "Fehlerhaftes" Bild von einem P/B Frame zum nächsten, bis der nächste Keyframe kommt, und dann wird es "hässlich".
MPEG-1/2 verwenden sogar noch kürze Abstände der Keyframes. Als Standard hat sich GOP 15 verbreitet durchgesetzt. Das bedeutet das alle 15 Frames ein Keyframe gesetzt wird. Zwischen diesen 15 Frames liegen die P/B Frames.
Hintergrund: Bei PAL und NTSC ergeben sich aufgrund der eigenen Framerate mathematisch die besten Bedingungen. Bei 75 Frames mit PAL sind es 5 Keyframes. (5x15=75) Bei NTSC bereits 4 nach 60 Frames. (4x15=60)
Nur bei reinem Film (24 frames) wird GOP 12 bevorzugt. Innerhalb 24 Frames liegen dann bereits 2 Keyframes. Deswegen sehen MPEG-2 codierte Filme "manchmal" besser aus, als MPEG-4, kommt aber auf die Einstellungen an und den natürlich den Codec.
Eine weitere MPEG-1/2 Variante ist das "Manual Keyframe-Setting". Hier wird eine Long GOP verwendet und explizit ein Keyframe bei jedem Scenenwechsel manuell gesetzt und dann ausgegeben, im 2-Pass VBR. In diesem Modus werden auch die P und B Frames manuell bestimmt. Man arbeitet sich also Bild für Bild durch den ganzen Film.
Wird allerdings selten gemacht, da jeder "Scenechange" einzeln markiert werden muss. Das dauert dann entsprechend lang, man hat dafür aber das beste Ergebnis.
CBR bei MPEG-1/2 Video "lohnt" sich nur, wenn man die Bitrate entsprechend hochdreht (Live Capture) oder wenn es das Format erfordert (VCD/SVCD z.B.).
Ich empfinde MPEG-4 als eine wundervolle Segnung und Alternative, aber man muss sich mit dem Format wirklich viel mehr auseinandersetzen als mit den Vorgängern von MPEG-1/2.
Konnte ich damit deine Frage "Warum ist das so ?" beantworten ?
Beste Grüsse, Mickey Lee.
Danke, aber für heute Abend zu viel Input für mich. Lese mich morgen mal "klug".
Antwort von Eisblume:
Hey!
@MLJ:
Woher hast du die ganzen Infos, was die Länge der GOP für die einzelnen Standards angeht? Ich suche schon ewig danach, v.a. was MPEG 2 Long GOP angeht, weil ich wissen wollte, wie lang die GOP denn ist. Ich hab gelesen, dass das variabel ist, aber wovon hängt das ab?
Ich habe ein Video mit der XDCAM EX von Sony im besagten Format aufgezeichnet und möchte dies im Rahmen meiner Abschlussarbeit nun mit einem H264-Encoder in unterschiedlichen, niedrigen Datenraten (kleiner 2 Mbit/s) ausgeben unter Hinzuziehen entsprechender Paramter, die für die einzelnen Datenraten relevant sind. Die Videos sollen an den mobilen Kontext angepasst sein - über passende Parameter informiere ich mich derzeit noch. Für unterschiedliche Datenraten könnten unterschiedliche Parameter eine Rolle spielen, um am Ende eine gute Qualität zu erzeugen. Denn darum geht es mir. Ich möchte wissen, wie weit ich mit der Datenrate runtergehen kann und immernoch eine subjektiv gute Qualität erhalte. Entsprechende Tests führe ich mit Probanden auf einem Smartphone und einem Tablet PC durch.
Ich suche nun nach wissenschaftlichen Ausarbeitungen, die darauf eingehen, wann welche Parameter entscheidend sind: und der H264-Encoder bietet da sehr viele Parametereinstellungen!!!
kann mir da jemend einen Tip geben, wo ich entsprechende Angaben finden kann?
Oder gibt es entsprechende Presets vielleicht schon für den mobilen Kontext?
Ich suche auch nach einem Dokument, welches sich wissenschaftlich mit der Frage auseinandersetzt, ob für die Wiedergabe auf einem mobilen Endgerät, das ja 30 fps wiedergibt, eine Codierung mit 25 oder 50 fps für eine gute Bildqualität überhaupt Sinn macht. Wisst ihr hierzu Näheres??
Außerdem frage ich mich, ob es sinnvoll ist, ein Video, das mit einer bestimmten GOP-Länge bereits in der Kamera encodiert wurde, beim Exportieren aus der Schnittsoftware mit ausschließlich I-Frames auszugeben. Geht dies in Richtung unkomprimierte Ausgabe?
Über Rüclmeldungen würde ich mich riesig freuen!
Grüße!
Antwort von Jott:
Ich möchte wissen, wie weit ich mit der Datenrate runtergehen kann und immernoch eine subjektiv gute Qualität erhalte. Entsprechende Tests führe ich mit Probanden auf einem Smartphone und einem Tablet PC durch.
Ich suche nun nach wissenschaftlichen Ausarbeitungen, die darauf eingehen, wann welche Parameter entscheidend sind: und der H264-Encoder bietet da sehr viele Parametereinstellungen!!!
Du meine Güte. Wissenschaft? Jedes anständige Encoder-Programm hat Presets für diverse Mobilgeräte an Bord, das wurde alles längst von anderen erledigt. Ob es dann passt (und meistens passt es) oder ob man eingreifen muss, hat nichts mit Wissenschaft zu tun, sondern primär mit dem Content: viel Bewegung, ruhige Kamera, Wackelkamera, hektische Schwenks oder ruhige Fahrten, saubere Qualität oder übles Gerausche ... je mehr "Action", je mieser die Ausgangsqualität, desto früher tauchen störende Artefakte auf. Je ruhiger und professioneller gefilmt wurde, desto besser wird es aussehen. Die Wissenschaft muss draußen bleiben, nur Augen auf. Empirik halt. Das kann man nicht in Tabellen und Formeln pressen.
Antwort von WoWu:
@MLJ
Du hast aber vergessen zu erwähnen, dass die I Frames wesentlich länger im Buffer gehalten werden, anders als in andern Codierverfahren und daher eine bessere Referenz bilden.
Ausserdem können so die P-Slices auf bis zu 16 I-Frames zugreifen, die im RAM gehalten werden.
Bisher war es in den Codecs mit minderer Prädiktionseffizienz so, dass die GoP im Speicher gehalten wurde und nur auf ein I-Frame zugreifen konnte.
Die Zeiten sind vorbei. Die Prädiktion ist erheblich genauer, weil es so etwas, wie eine GoP der "alten Generation" gar nicht mehr gibt.
Ausserdem kommt den B-Frames im AVC ein anderer Stellenwert zu, da sie ebenso als I-Frames genutzt werden können. Daüber hinaus beziehst Du die I-Frames in AVC vermutlich auf IDR Frames, das ist noch ein kleiner Unterschied.
Auch betrachtest Du nicht die Slice-Möglichkeit, die andere Codecs nicht haben und die dazu führen, dass erforderliche Bildbereiche sehr häufig ausgetauscht werden, unabhängig vom zugrundeliegenden Basiframe.
Alles Dinge, die man bei einem Codecvergleich berücksichtigen muss.
Man darf nicht, wie Du auch sagst, nur starr auf Framebezeichnungen achten, sondern muss schon einwenig Verständnis mitbringen, wie die Codecs funktionieren.
Daher ist so ein MPEG2/4 Vergleich eigentlich nicht wirklich möglich.
Solche Vergleiche "hinken" also an allen Ecken und Kanten.
Antwort von MLJ:
@Eisblume
Vorwiegend Bücher ;-) Aber es gibt auch im Internet jede Menge darüber zu lesen. Einfach den Suchbegriff "Motion Pictures Experts Group" eingeben. Hier noch ein guter Link:
http://mpeg.chiariglione.org/
@WoWu
Zitat:
"Man darf nicht, wie Du auch sagst, nur starr auf Framebezeichnungen achten, sondern muss schon einwenig Verständnis mitbringen, wie die Codecs funktionieren. Daher ist so ein MPEG2/4 Vergleich eigentlich nicht wirklich möglich. Solche Vergleiche "hinken" also an allen Ecken und Kanten."
Zitat ende
Da hast du Recht. Aber leider scheinen sich zu wenige mit dieser Materie zu befassen und MPEG war schon immer eine Wissenschaft für sich. Und was die Änderungen bei MPEG-4 gegenüber MPEG-2 betrifft, die du erwähnt hast, ist mir bekannt. Nur wollte ich "timelapse" nicht mit zu viel Info "erschlagen".
Beste Grüsse, Mickey Lee
Antwort von WoWu:
Das ist ja sehr löblich, aber Du läufst natürlich Gefahr, dass er deine Infos (ebenso wie den Kram in dem Tutorial Video) für bare Münze nimmt und aus den einfachen Frame-Vergleichen die falschen Schlüsse zieht.
Dann doch lieber genau sein, auf die Gefahr hin, dass er es nochmal nacharbeiten muss.
Lieber richtig als falsch.
Fakt ist, dass die GoP von MPEG2 und MPEG4AVC bis auf die (teilweise) gleichen Bezeichnungen nichts miteinander zu tun haben, insofern auch so einfachen Vergleichen nicht Stand halten.
Antwort von MLJ:
@WoWu
...Smile... also dann lieber "Romane" im Forum schreiben ? ;-) Aber du hast ja wiedermal Recht, sowas kann man nicht einfach nur an der Oberfläche behandeln. Und was die Vergleiche betrifft, so gebe ich dir Recht und letztendlich kann man das wirklich nur Visuell beurteilen, wenn überhaupt.
Beste Grüsse, Mickey Lee