Der chinesische Internetgigant Alibaba hat eine neue Video-KI veröffentlicht, die den Erfolg von DeepSeek im Bereich LLM wiederholen könnte. Denn Alibabas neues Wan2.1-Mo... Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten: Wan2.1 - beste kostenlose Video-KI für den Home-PC?
Also ... ja, ich finds echt gut. Habe gestern installiert und heute mal zwei Image 2 Video ausprobiert. Doch schon sehr cool. Mit jeweils kurzen Prompts ein Urlaubsfoto meiner Frau in Bewegung gesetzt, sie winken und auf mich zukommen lassen. Sah sehr natürlich aus. Und ein schwarz-weißes Gruppenfoto der Hochzeit meiner Oma von 1935 in Bewegung gesetzt. Plötzlich eine recht muntere Gesellschaft. Und zwar auch das sehr natürlich. Cool. Werde die jetzt nirgends hochladen, bevor einer fragt.
Allerdings sind die versprochenen 12 Sekunden ... ja wo sind sie denn? Also das auf 16 FPS trainierte Modell macht gern bis zu 81 Frames (5 Sek). Dafür braucht es bei mir bei 1280x720 etwa 2 Stunden auf einer RTX 3090. Laut Beschreibung bei GitHub sollte man nicht länger als 5 Sekunden machen. Teste ich übers Wochenende vielleicht trotzdem mal. Vielleicht lass ich die Hochzeitsgruppe noch tanzen.
Den 16 FPS macht man übrigens mit Flowframes Beine. Leider gehen nur geradzahlige Multiplier für die Framerate, so hab ich die jetzt alle bei 48 FPS.
Nicht zu finden ist im übrigen das versprochene Video zu Video Modell, sowie das hier im Slashcam Text genannte Audio-to-Video Modell. Ich hab auch nicht die Wan-AI Modelle genommen, sondern die von Kijai.
Wenn sich noch Zeit findet versuche ich auch mal das Text2Video Modell. Aber so qualitativ find ichs schon recht gut. Ähja, und eben lokal :-)
Grüße,
Frankie
Rechtliche Notiz: Wir übernehmen keine Verantwortung für den Inhalt der Beiträge
und behalten uns das Recht vor, Beiträge mit rechtswidrigem oder anstößigem Inhalt zu löschen.