LTX-2 von Light-Tricks will das erste Open Source KI-Modell für generative Videoerstellung sein, das alle modernen State-of-the-Art-Kernfunktionen in einem Modell vereint: Dies sind synchronisierte Audio- und Video-Ausgabe (in bis zu 4K 50fps, max. 20sec), hohe Wiedergabetreue, mehrere Wiedergabemodi, produktionsfertige Ausgänge, API-Zugriff und eben offener Zugang zu Gewichten und Trainings-Code.
Dadurch ist es prinzipiell möglich, das gesamte Modell auch am heimischen PC laufen zu lassen, allerdings wird von Light-Tricks noch mindestens eine 32GB Nvidia-GPU vorausgesetzt, womit die günstigste Lösung wohl eine Nvidia RTX 5090 darstellt. (Empfohlen wird übrigens eine 80GB GPU). Doch selbst wer ein solches Modell im Rechner hat, sollte mit dem bislang veröffentlichten Code auch noch 64 GB auf der CPU-Seite mitbringen, was bei der aktuellen RAM-Dürre auch nochmal ein kostspieliges Update-Unterfangen bedeuten kann. Ansonsten finden sich sicherlich sehr bald zahlreiche KI-Cloudservices, mit denen man das Modell online (be)nutzen kann.

Ebenso finden sich im Netz bereits zahlreiche Code-Abwandlungen, welche das Modell durch Gewichtsreduktion/Quantisierung noch kleiner komprimieren - allerdings mit Abstrichen bei den Möglichkeiten und der Qualität. Dies ist insofern interessant, weil man hiermit sehr kostengünstig zuhause ein Video-Prototyping betreiben kann und anschließend gelungene Clips in hoher Qualität in der Cloud erstellen lässt.
Den Entwicklern lag auch eine Day-1-Unterstützung von ComfyUI am Herzen, weshalb erfahrene Anwender hier ohne große Einstiegshürden direkt loslegen können. Trotz Open Source gibt es bereits viel Infrastruktur um das Modell, wie dokumentierte API-Calls oder auch einen Prompting Guide. In ComfyUI-LTX-2-Pipelines hilft der "enhance_prompt"-Parameter, der noch vor der Generation eine automatische Verbesserung des Prompts vornehmen kann.
// Top-News auf einen Blick:
- Nikon verklagt Hersteller von Z-Mount Objektiven - in Zukunft weniger und teurer?
- Fake oder nicht? Image Whisperer - neues kostenloses Profi-Tool erkennt KI-Bilder
- Apple stellt mit MacBook Neo günstigstes MacBook mit A18 Pro mobiler CPU vor
- GoPro scheint an einer kompakten Cine-Kamera zu arbeiten
- Kleines Upgrade und neues Topmodell - Apple Studio Display und Studio Display XDR
- Neue Apple MacBook Pro und Air Modelle, erstmals auch mit M5 Pro und M5 Max
Wer das Modell für eigene Projekte feintunen will, findet hier bereits Dokumentation und Tipps zum LoRA-Training.
Die Demos zur Open Source Öffnung sehen teilweise schon sehr überzeugend aus:
Als erstes Videofoundation-Modell setzt LTX-2 damit zum Jahresstart die Messlatte für Open Source KI ein gutes Stück höher. Und wenn man bedenkt, was man mittlerweile aus einer (zugegebenermaßen recht teuren) Gaming-Grafikkarte für Videos zaubern kann, darf man schon ein bisschen staunen. Die Entwicklung der neuen Möglichkeiten in der KI-Videografie - seien sie auch größtenteils nur Slop (Schund) - ist zugleich auch immer wieder faszinierend anzusehen.


















