slashCAM
Administrator
Administrator
Beiträge: 11279

CogVideoX: Neue Open Source Video-KI läuft auf Consumer GPUs

Beitrag von slashCAM »


Das gerade veröffentlichte, quelloffene Text-zu-Video-Modell CogVideoX hat das Potential, die Video-KI Revolution nochmals deutlich zu beschleunigen, denn der Code wurde ...

Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
CogVideoX: Neue Open Source Video-KI läuft auf Consumer GPUs



medienonkel
Beiträge: 949

Re: CogVideoX: Neue Open Source Video-KI läuft auf Consumer GPUs

Beitrag von medienonkel »

Ja, weiß nicht....

Mal mein durchaus sehr lehrreicher Erfahrungsbericht von einem im Nachhinein blauäugigen Experiment, dem ich mich anfangs durchaus gewachsen sah.
Klar, Vieles ist meiner Schusseligkeit und fehlender ernsthafter Expertise in der Kommandozeile geschuldet, jedoch war es seit langem eine unbefriedigende Erfahrung aus dem Kreise der AI-Superdupernews.

Also entschloss ich mich, das mal zu testen.
Doof, wie ich bin, konnte ich mit der git repo nicht direkt was anfangen. Da brauchts ja wieder diese und jene dependency...

Also nach einer Anleitung gesucht und schließlich in Textform fündig geworden.

Ich habe aber dummerweise ein kleines Detail erst im Prozess der ersten (es gab unzählige Versuche) Installation erkannt und vor lauter Neugier auf das erhoffte Ergebnis der Installations-Anleitung leider lange nicht realisiert....

Erst nach gut vier Stunden Gaudi mit Python, Ana- und miniconda (falsche Version...muss mich doch mal mit venvs beschäftigen-Erkenntnis), pip, git und powershell kam ich langsam drauf, dass es da wohl grundlegende Probleme unter Windows gibt:
Das läuft aktuell scheinbar nur auf Linux!

Hat meinem Verständnis nach irgendwas mit unterschiedlichen Pytorch Varianten für Linux/Windows zu tun. (Eine entsprechende Kompilierung wollte ich mir echt nicht auch noch antun, um das mal eben zu checken. Nachdem ich eh endlich mal Richtung Linux gedacht habe)
Ich konnte sogar das Playbook öffnen, alle Modelle und weitern Abhängigkeiten runterladen und dann brachs ab als es ums Rendern ging. Fehlermeldung zu nicht vorhandenem Pytorch. War aber installiert und vorhanden. Auch das passende Cuda SDK. (11.8)

Bei der Anleitung, die ich genutzt habe, war Linux zu - meiner Entschuldigung - nicht mit einem Buchstaben erwähnt.
Die Anleitung zu Deep Face Cam von der Quelle hatte einwandfrei für Windows funktioniert. Wobei ich da auch einen kleinen "Hack" (Umbenennen und Löschen einer Modelldatei) zufällig entdecken musste, um das zum laufen zu bringen.

Dann auf Windows WSL gestoßen. Noch nie davon gehört. War echt noch interessant... (ein Bärtiger Typ auf YouTube hatte mich da in seinem Bann, man könne auch fertige scripte auf seinem patreon erwerben! aber hier zeigt er es einem ganz easy nebenbei in einem 30 Minütigem Video. Keine Chance, der Cowboyhut lenkt zu sehr ab. )

Die Kiste, die natürlich nicht auf VM gestellt war, noch eben auf Virtualisierung im Bios umzustellen, war der nächste kurze Schritt.
Neustart.
Schnell ins Bios. Wo auch immer man die VM Unterstützung aktiviert.

Okay: "ENTF" drücken (ganz schnell! komm, du bist Drummer!)

Nix.
Immer direkt zum Bootscreen.

Ach stimmt.....da war ja was...
Hatte mal auf doof "Fastboot" eingestellt.....seitdem keine Chance mehr mit der Tastatur ins Bios zu kommen. Bios reset also auch noch.
Danke Merkel!

Nachdem ich kurz davor war, die Deutschland GmbH für alles verantwortlich zu machen, kam ich doch noch zur Besinnung.

Zweiphasig vom Netz trennen..
"Cyceln"
Gehäuse auf.

Mit einem Schraubenzieher die zwei Pins kurzschließen.
Sich daran erinnern, schon lange einen Taster dafür einbauen zu wollen.
Es aber nie macht.

Also, alles im Bios neu einstellen.
Checken, dass das Windows noch einwandfrei läuft.
(Da noch eben die verhunzten Python und Cuda SDK Installationen fixen und ein paar Testläufe machen)

Da war es zwar schon 5 in der Früh, aber so ein virtuelles Linux und alles nur mit Kommandozeile hat ja auch was nach einer Flasche Wein, die man zu Rate gezogen hat.

Ja. Ne, hatte nichts.
Irgendwann hab ich´s geschafft einen User zu kreieren, der was durfte....danach liefen die Downloads ins Leere und conda war zwar installiert, aber nicht nutzbar usw. bla bla

Schließlich landete dann eine richtige Linux Installation auf meinem Rechner.

Dann die Lüfter!
Unter Linux lief natürlich die Softwaresteuerung der Lüfter nicht. Also griff das viel zu dumme Motherboard ein.

Noch zwei Stunden in die Suche nach einer entsprechenden Softwarelösung unter Linux investiert.
Ergebnis:
Keine PWM-Lüfter vorhanden. Soso... interessant.
Furchtbar.

Okay, dann föhnt es halt. Während draußen die Vögel zwitschern und es schon erstaunlich hell ist.

Um X Uhr lief dann alles, es wurde wohl ein Video generiert (Uhrzeit könnte hinhauen).
Hatte aber nichts mit dem Prompt zu tun.

Alles, was ich danach versucht habe, brach mit Fehlermeldung bzgl. zu wenig Grafikspeicher ab.

Daher mal meine Frage, ob das hier mal jemand zum Laufen gebracht hat.
Angeblich läuft die kleine Variante des Modells ja schon ab 5 GB GRAM.
Ich hätte 24 GB anzubieten.

Bin nun noch nicht so weit, mich ernsthaft in die manuelle Speicheradressierung der GPU einzuarbeiten, was einem die Fehlermeldung ans Herz legt.

Zugegeben:
Nutzt man die Online Variante auf Huggingface hat man eh für Normalos unbezahlbare Rechenleistung zur Verfügung (vermutlich virtuell geteilt).
Damit hab ich mich aber mangels Zeit nun noch nicht beschäftigt.

Ich mach sowas ja gerne und meist kommt einer wie ich, der sich nur als interessierten Laien mit 2 Semester Informatik und 30 Jahren Programmierhintergrund sieht, ans Ziel.
Hier nicht.


Muss ich mich jetzt echt komplett in die Cloud übergeben?

Sicher nicht, aber momentan komm ich da nicht weiter.

Irgendwelche anderen Erfahrungen?



cantsin
Beiträge: 16389

Re: CogVideoX: Neue Open Source Video-KI läuft auf Consumer GPUs

Beitrag von cantsin »

Das ganze generative KI-Zeugs ist eine einzige Python-Dependency-Hölle, auch wenn man Linuxer ist.

Bei mir tut es zur Zeit Stable Diffusion WebUI nicht mehr, weil es eine ältere Python-Version verlangt, die unter einem aktuellen Debian Linux nicht mehr zur Verfügung steht.

Wahrscheinlich helfen da langfristig nur AppImages oder Docker-Container.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



medienonkel
Beiträge: 949

Re: CogVideoX: Neue Open Source Video-KI läuft auf Consumer GPUs

Beitrag von medienonkel »

Da weiß man wieder, was eine Installationsdatei an Arbeit abnimmt.

Stable Diffusion läuft bei mir jetzt auch nur noch sehr seltsam. Kommt zwar was raus, sieht aber alles nicht zu Ende diffused aus.

Für easy diffusion gibt's mittlerweile einen richtigen Installer.

Muss das oft an die mlv App denken, ein Traum.

Die online Variante ist eh schneller, als es mein Rechner kann. Da hängt man einfach auf einer H100 herum.



 Aktuelle Beiträge [alle Foren]
 
» Sony soll eine FX8 mit 12K-Sensor für den Herbst planen
von Mantas - Mo 10:14
» Suche XLR-Kamera-Mikrofon
von cantsin - Mo 0:36
» Panasonic LUMIX S9 - Kleinste 6K V-Log Kamera für 1.699 Euro
von Darth Schneider - So 18:20
» Illusionen
von manfred52 - So 11:53
» Sollte ich das Firmware updat bei meiner EOS R8 durchführen?
von walang_sinuman - Sa 14:37
» Manueller Focus mit Darstellung der Entfernung in Metern?
von Jörg - Sa 13:40
» Accsoon CineView M7 Pro - smarter SDI/HDMI Funkmonitor
von slashCAM - Sa 11:33
» Gimbal Panasonic s5 ii
von Darth Schneider - Sa 5:23
» Werbung - es geht auch gut ;) Sammelthread
von Bluboy - Fr 17:59
» Seagates 30 TB HAMR-Festplatten ab sofort im Handel frei erhätlich
von slashCAM - Fr 9:30
» AV1 Codec in Premiere
von Bluboy - Do 19:19
» Sigma 17-40mm F1.8 DC ART an Sony FX30 und DJI RS4 Mini im Praxistest / Teil 1
von rush - Do 17:46
» Nanlite pico - neues, kompaktes Vollfarben-LED-Panel für die mobile Videoproduktion
von Alex - Do 17:02
» Neu in Adobe Firefly - Sound Effects, Kompositionsvorlagen und mehr
von slashCAM - Do 15:36
» ACHTUNG WETRANSFER!
von rush - Do 14:02
» DaVinci Resolve 20 Workshop - AI Depth Map unkompliziert für Titel-Effekte nutzen
von speedy gonzales - Do 13:58
» DJI Mavic 4 Pro in der Praxis: 10Bit 6K 50p Log, 360° Gimbal – für wen lohnt sich die C2 Drohne?
von wind1414 - Do 10:28
» Neue Lexar NM990 PCIe 5.0 SSD liest Daten mit bis zu 14.000 MB/s
von slashCAM - Do 10:24
» DJIs Mic 3 Funkmikro kommt bald zusammen mit der Osmo 360 Kamera
von tom - Do 10:10
» Panasonic LUMIX S1II im Praxistest: Beste Video-DSLM ihrer Klasse Dank 5.1K Open Gate u. hohem DR?
von radneuerfinder - Mi 23:20
» Sony ECM-778 - neues XLR-Richtmikrofon mit Hi-Res Audio für Profis
von TomStg - Mi 19:39
» Biete: Tascam DR-10C Mini Rekorder
von pillepalle - Mi 18:17
» Biete: Fuji X-E1 Body - 16,3MP APS-C
von pillepalle - Mi 18:10
» Nikon Z f Vollformat DSLM im Retro-Look (FM2) für 2.499,- Euro vorgestellt: 24MP Sensor, 4K 10 Bit 60p Â…
von Funless - Mi 16:36
» Neue Nikon Z8 Firmware 3.01 soll Objektiv-Kompatibilität verbessern
von slashCAM - Mi 15:21
» Konkurrenz für IMAX - Neues HDR-Premiumkinoformat Vue Epic für Europa
von dienstag_01 - Mi 14:13
» Panasonic LUMIX S1II und S1IIE für Videofilmer - bis zu 15 Blendenstufen und ARRI Log
von roki100 - Mi 12:44
» Zwei leichte Samyang Prima-Objektive (16mm / 85mm) für Sony E vorgestellt
von slashCAM - Mi 10:12
» RØDE Wireless Micro: Ab sofort auch kabellose iPhone-Aufnahme ohne Empfänger
von Blackbox - Di 17:46
» Zoom M3 Mictrak Erfahrungen?
von Jörg - Di 15:46
» Social Media, KI & Co. - Neue Gefährdungslagen für die Meinungsvielfalt
von Blackbox - Di 15:46
» Zittern mit 50fps Clip in 25fps Timeline
von blueplanet - Di 13:14
» "32 Bit float" Recording - Ist das wirklich besser?
von ksingle - Di 12:37
» Neue Dummy-Adapter von SWIT für NP-F-, LP-E6- und NP-FZ100-Akkus
von Blackbox - Di 2:37
» LensNode Plug-In
von j.t.jefferson - Mo 22:36