Die Clips sind 3 bis 12 Sekunden lang und bestehen aus einigen wenigen Bildern.
Vor allem aber verstehen die KIs Texteingaben eher schlecht als recht.
Ein kugelförmiges Raumschiff neben dem Mond und die Erde im Hintergrund - also als Prompt:
"A spherical spaceship next to the moon and the Earth in the background"
Shot 1.jpg
Auch genauere Beschreibungen führen nicht zu dem, was man will. Damit ist LTX Studio aber nicht alleine.
Bei Firefly hatte ich dann sogar ein Bild vorgegeben.
Ein 12 Sekunden Video ohne Mond, dafür mit gleich Sonnen, die sich spiegeln hab ich bisher hinbekommen:
Shot 1.mp4_snapshot_00.01_[2024.08.23_17.20.32].jpg
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.