LTX-2 von Light-Tricks will das erste Open Source KI-Modell für generative Videoerstellung sein, das alle modernen State-of-the-Art-Kernfunktionen in einem Modell vereint: Dies sind synchronisierte Audio- und Video-Ausgabe (in bis zu 4K 50fps, max. 20sec), hohe Wiedergabetreue, mehrere Wiedergabemodi, produktionsfertige Ausgänge, API-Zugriff und eben offener Zugang zu Gewichten und Trainings-Code.
Dadurch ist es prinzipiell möglich, das gesamte Modell auch am heimischen PC laufen zu lassen, allerdings wird von Light-Tricks noch mindestens eine 32GB Nvidia-GPU vorausgesetzt, womit die günstigste Lösung wohl eine Nvidia RTX 5090 darstellt. (Empfohlen wird übrigens eine 80GB GPU). Doch selbst wer ein solches Modell im Rechner hat, sollte mit dem bislang veröffentlichten Code auch noch 64 GB auf der CPU-Seite mitbringen, was bei der aktuellen RAM-Dürre auch nochmal ein kostspieliges Update-Unterfangen bedeuten kann. Ansonsten finden sich sicherlich sehr bald zahlreiche KI-Cloudservices, mit denen man das Modell online (be)nutzen kann.

Ebenso finden sich im Netz bereits zahlreiche Code-Abwandlungen, welche das Modell durch Gewichtsreduktion/Quantisierung noch kleiner komprimieren - allerdings mit Abstrichen bei den Möglichkeiten und der Qualität. Dies ist insofern interessant, weil man hiermit sehr kostengünstig zuhause ein Video-Prototyping betreiben kann und anschließend gelungene Clips in hoher Qualität in der Cloud erstellen lässt.
Den Entwicklern lag auch eine Day-1-Unterstützung von ComfyUI am Herzen, weshalb erfahrene Anwender hier ohne große Einstiegshürden direkt loslegen können. Trotz Open Source gibt es bereits viel Infrastruktur um das Modell, wie dokumentierte API-Calls oder auch einen Prompting Guide. In ComfyUI-LTX-2-Pipelines hilft der "enhance_prompt"-Parameter, der noch vor der Generation eine automatische Verbesserung des Prompts vornehmen kann.
// Top-News auf einen Blick:
- Samsung Portable SSD P9 - Erste mobile USB4-Festplatte mit 8 TB
- PixVerse-R1 - interaktive Welt per Prompt in Echtzeit generieren und erkunden
- Behringer FLOW 4V: Mobiler 10-Spur-Recorder/Mixer mit 32-Bit-Float
- Verklagt Nikon Viltrox wegen Patentverletzung des Z-Mounts?
- Novachips zeigt erste 2 und 4 TB CFexpress-4.0-Karten mit VPG-800-Zertifizierung
- Apple stellt Creator Studio vor - Abomodell für Final Cut Pro, Motion, Logic Pro
Wer das Modell für eigene Projekte feintunen will, findet hier bereits Dokumentation und Tipps zum LoRA-Training.
Die Demos zur Open Source Öffnung sehen teilweise schon sehr überzeugend aus:
Als erstes Videofoundation-Modell setzt LTX-2 damit zum Jahresstart die Messlatte für Open Source KI ein gutes Stück höher. Und wenn man bedenkt, was man mittlerweile aus einer (zugegebenermaßen recht teuren) Gaming-Grafikkarte für Videos zaubern kann, darf man schon ein bisschen staunen. Die Entwicklung der neuen Möglichkeiten in der KI-Videografie - seien sie auch größtenteils nur Slop (Schund) - ist zugleich auch immer wieder faszinierend anzusehen.


















