Postproduktion allgemein Forum



CUDA ist deutlich schneller



Fragen rund um die Nachbearbeitung, Videoschnitt, Export, etc. (div. Software)
Antworten
hannes
Beiträge: 1174

CUDA ist deutlich schneller

Beitrag von hannes »

Hallo in die Runde,

habe in Loiloskope spaßeshalber mal einen kleinen Film gerendert:

Mit CPU nach MP4 5:46min
Mit CUDA noch genau 1:57min

Was enthalten uns die anderen Schnittsysteme da vor?
Die Technik wird doch von NVidia schon lange bereit gehalten.
Glückauf aus Essen
hannes



Georg
Beiträge: 322

Re: CUDA ist deutlich schneller

Beitrag von Georg »

Cyberlink unterstützt in PowerDirector CUDA
Gruß Georg
Einsteigerbücher für den Videoschnitt: www.video-intern.com



hannes
Beiträge: 1174

Re: CUDA ist deutlich schneller

Beitrag von hannes »

Richtig, aber die "Namhaften" eben doch nicht.
Schon was von Canopus oder Corel gehört?
Ich nicht.
Glückauf aus Essen
hannes



Jörg
Beiträge: 10836

Re: CUDA ist deutlich schneller

Beitrag von Jörg »

Schon was von Canopus oder Corel gehört?
so lange bei Canopus die Firecoder blu für richtiges Geld angeboten und verkauft wird, dürfte das Interesse dort für eine interne Lösung sehr, sehr
gering sein ....



domain
Beiträge: 11062

Re: CUDA ist deutlich schneller

Beitrag von domain »

Was mir immer noch nicht klar ist, unterstützt CUDA eigentlich auch die Timelineoperationen selbst oder bezieht sich die Geschwindigkeitssteigerung nur auf den finalen Renderprozess?



pailes
Beiträge: 938

Re: CUDA ist deutlich schneller

Beitrag von pailes »

hannes hat geschrieben:Was enthalten uns die anderen Schnittsysteme da vor?
Die Technik wird doch von NVidia schon lange bereit gehalten.
Eine Umstellung auf eine API wie Cuda ist bei Weitem nicht trivial. Ich denke viele Hersteller experimentieren mit solchen Bibliotheken, aber wie effizient das Ergebnis ist, hängt auch davon ab, in welchem Zustand sich der bestehende Render-Code einer Schnittlösung befindet. Eine Umstellung passiert da nicht innerhalb von ein paar Tagen, da können schon einige Monate vergehen bis das alles nachgezogen wurde. Und Cuda ist eine reine NVidia-Technologie, Besitzer von ATI-Karten schauen dann in die Röhre.

Mit ein bisschen Glück werden wir mit OpenCL (http://de.wikipedia.org/wiki/OpenCL) eine entsprechende Hardware-Unabhängige Lösung bekommen, auf die die Software-Hersteller setzen können.
domain hat geschrieben:Was mir immer noch nicht klar ist, unterstützt CUDA eigentlich auch die Timelineoperationen selbst oder bezieht sich die Geschwindigkeitssteigerung nur auf den finalen Renderprozess?
Was meinst Du denn mit "Timeline-Operation"?



domain
Beiträge: 11062

Re: CUDA ist deutlich schneller

Beitrag von domain »

Na alles was halt beim Schneiden so anfällt inkl. Echtzeitvorschau.
Wird diese denn auch durch CUDA beschleunigt?



Mylenium
Beiträge: 1303

Re: CUDA ist deutlich schneller

Beitrag von Mylenium »

hannes hat geschrieben:Was enthalten uns die anderen Schnittsysteme da vor?
Die Technik wird doch von NVidia schon lange bereit gehalten.
Öhm, zu Zeiten der CUDA-Beta und beim Release der v1 gab's gerade mal 3 Grafikkarten der GeForce 7xxx Serie oder so, die das (theoretisch) konnten, aber in der Praxis dank verbuggter Treiber doch nicht alle Features funktionsfähig verwenden konnten. Erst mit der 8xxx Serie ging das richtig los. Außerdem ist GPU-Code ganz anders gestrickt als CPU-Code, das macht man nicht mal so auf die Schnelle. Und selbst dann ist noch die Frage, ob es Sinn macht. Sehr komplexe Konstrukte, die nur ab einer sehr hohen Anzahl von Shadereinheiten funktionieren, also damit nur auf teuren Karten, nützen niemandem was. Da ist der Aufwand in der Entwicklung im Vergleich zum potenziellen Absatz solcher Karten zu groß. Und naja - GPU-Code ist immer noch weitestgehend Single-Precision. Selbst für MPEG-Kodierung muss man da im Zweifelsfall schon Kompromisse eingehen. Außerdem, und das its ja das Problem, muss ja immer noch eine Variante dabei sein, die als "software only" auf der CPU funktioniert, falls das Zielsystem CUDA nicht unterstützt. Allein die dazu nötigen Sicherheitsmechanismen, um nicht ständig den Rechner abzuschiessen, erfordern schon einiges and Geschick und Bedacht...

Mylenium
[Pour Mylène, ange sur terre]



Mylenium
Beiträge: 1303

Re: CUDA ist deutlich schneller

Beitrag von Mylenium »

domain hat geschrieben:Na alles was halt beim Schneiden so anfällt inkl. Echtzeitvorschau.
Wird diese denn auch durch CUDA beschleunigt?
Also bei Loilo steht da nix davon und bei anderen Programmen müßte man das sehen. Die Frage ist aber eher akademischer Natur - für's reine Abspielen sind andere Faktoren wesentlich wichtiger als die Prozessorpower zum dekodieren. Das funzt ja selbst auf 400 Euro Billigrechnern mittlerweile.

Mylenium
[Pour Mylène, ange sur terre]



jazzy_d
Beiträge: 990

Re: CUDA ist deutlich schneller

Beitrag von jazzy_d »

Die h.264 Karten von Matrox und Canopus sind ja auch "nur" für das finale Exportieren.



domain
Beiträge: 11062

Re: CUDA ist deutlich schneller

Beitrag von domain »

Mylenium hat geschrieben: Die Frage ist aber eher akademischer Natur - für's reine Abspielen sind andere Faktoren wesentlich wichtiger als die Prozessorpower
Bei einem NLE ist diese Frage aber nicht akademischer sondern rein praktischer Natur.
Ob das finale Rendern nämlich beschleunigt wird ist mir relativ egal.
Auf die Beschleunigung der Timelineoperationen speziell unter AVCHD kommt es vorwiegend an.



WoWu
Beiträge: 14819

Re: CUDA ist deutlich schneller

Beitrag von WoWu »

Die Antwort ist: ja
Das Problem ist in CPU Architekturen, dass eine GoP in den Hauptspeicher geladen, abgearbeitet und gelöscht wurde. Die MPEG2 Gops hatten aber nur ein I-Frame. Das I-Frame musste also nur so lange im Speicher gehalten werden, bis die GoP abgearbeitet war. H.264 hat aber bis zu 16 I-Frames und GoP Länge von z.B. 90. Das bedeutet, dass es nicht nur mehr Speicherbedarf für die 16 I-Frames gibt, sondern diese auch noch (statt 1/2 sec. jetzt 4 sec) im Speicher gehalten werden müssen. Auch die Menge der Referenz-Zugriffe erhöht sich entsprechend.
Es kommt hinzu, dass auch B-Frames (Slices) als Referenz für die Bewegungskompensation benutzt werden, was bisher nicht möglich war. Daher liegt der grundlegende Unterschied zwischen P- und B-Slices nur noch in der Art, in der die Makroblöcke codiert werden.
In B-Slices kann das Prädiktionssignal aus dem gewichteten Mittel zweier unterschiedlicher Prädiktionswerte gebildet werden.
B-Slices benutzen dazu zwei verschiedene Referenzbildpuffer, ein Umstand, der erhebliche Anforderungen an die Rechnerarchitektur stellt.
All dies, und noch einiges mehr, wird vom zusätzlichen DSP ausgeführt und verändert natürlich auch das Verhalten bei einem echtzeit-orientierten Bildaufbau.
Die bisher bei den Camcordern zum Einsatz gekommenen Codecs haben lediglich 4 I-Frames benutzt (auch im Hinblick auf die noch schwache Rechnerarchitektur) und dadurch natürlich auch nicht die Möglichkeiten des Codecs ausgeschöpft. Das dürfte sich aber mit den veränderten Architekturen auch ändern.
Gute Grüße, Wolfgang

E-Book:
www.provideome.de



 Aktuelle Beiträge [alle Foren]
 
» GoPro stellt neue 360-Grad-Kamera MAX2, Lifestyle-Kamera LIT HERO und einen KI-Gimbal vor
von berlin123 - Mi 14:03
» Sechs Meter hohe Flamme freistellen?
von Onfire - Mi 13:15
» DJI Mini 5 Pro wiegt über 250g - bleibt aber trotzdem in der Dronenklasse C0
von dienstag_01 - Mi 12:12
» Endlich mal wieder originelle Ansätze im Kino
von Axel - Mi 11:32
» Blackmagic DaVinci Resolve 20.2.1 bringt Verbesserung fürs Editing und mehr
von freezer - Mi 11:12
» Impressumspflicht -》aktuelle regelungen und lösungen
von dienstag_01 - Mi 10:03
» DJI Osmo Nano ist da - zweiteilige Mini-Actioncam kostet ab 279 Euro
von rush - Mi 8:18
» 19 Jahre alt und keinen Plan wie ich in die Branche komme
von Phil999 - Mi 5:47
» Empfehlung Hauptmikros Stereo Chor- / Orchester
von vago - Di 21:22
» Stabileye
von Phil999 - Di 14:30
» Neuer Atomos Ninja TX, Shinobi 7RX + neuer Reference Monitor erklärt
von MarcusG - Di 14:20
» Italien: Mindestens 1 Jahre Gefängnis für Deepfakes ohne Einwilligung
von stip - Di 14:02
» Atomos Sun Dragon - 5-Farben-HDR-LED-Lichtstreifen mit CRI99 Lichtgüte
von Asjaman - Di 8:59
» Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?
von roki100 - Di 0:54
» !!BIETE!! ZEAPON MICRO 2 Slider 54cm bis 5KG
von klusterdegenerierung - Mo 23:40
» Blackmagic liefert PYXIS 12K aus - Kompakte Cine-Kamera mit 12K Vollformatsensor
von iasi - Mo 23:35
» !!BIETE!! ZEAPON Easylock 2 Tisch Stativ für MICRO 2 Slider
von klusterdegenerierung - Mo 20:23
» !!BIETE!! ZEAPON Motor für MICRO 2 Slider
von klusterdegenerierung - Mo 20:22
» Was schaust Du gerade?
von Darth Schneider - Mo 18:08
» !!BIETE!! TILTA Nucleus Nano I
von klusterdegenerierung - Mo 17:10
» ALEXA 35 Update: ARRICORE für Xtreme & neue Features für alle Modelle
von slashCAM - Mo 15:18
» Was hörst Du gerade?
von Funless - Mo 14:46
» DaVinci Cache auf welche SSD?
von dienstag_01 - Mo 12:57
» DJI MIC 2 - XLR Adapter
von rush - Mo 12:17
» Was tun, wenn das Wasser fehlt? Klimawandelfolgen-Doku Teil 2
von Darth Schneider - Mo 6:37
» Caspar David Friedrich - Filter
von Axel - So 13:39
» iPhone 17 Pro: ProRes RAW, Genlock, Apple Log 2 und Blackmagic ProDock für Filmer
von Axel - So 13:27
» Wiegt die DJI Mini 5 Pro wirklich unter 250 Gramm?
von Jost - So 10:46
» Aputure NOVA II 2x1 - 1.000W LED-Panel mit BLAIR-CG-Engine
von Jominator - So 10:31
» Neue Funktionen für Frame.io verbessern Sicherheit und Sharing
von slashCAM - So 9:33
» Apple Final Cut Camera 2.0 bringt iphone 17 Pro Apple Log 2, Genlock und Open Gate
von vaio - Sa 12:40
» Nikon NRAW als RED RAW prozessieren
von cantsin - Sa 11:48
» Canon Cinema EOS C50 Sensor-Bildqualität - Debayering, Rolling Shutter und Dynamik
von Walter Schulz - Sa 9:40
» Leitz Hektor - sechs Cine-Objektive für DSLM & Co vorgestellt
von philr - Sa 9:25
» Licht how to:
von Darth Schneider - Sa 8:53