Erst wartet man ein dreiviertel Jahr und dann geht es plötzlich Schlag auf Schlag: soeben hat OpenAI seine Video-KI Sora für ChatGPT-Abonnenten freigegeben; bereits heute Nacht war ja ein Präsentationsvideo durchgesickert. Sora bringt ei ige interessante Features für KI-Filmemacher mit. Leider aber bleiben Europa und China zunächst außen vor.
Mit dem offiziellen Launch (bisher hatten nur einige ausgewählte Filmemacher einen Zugang) beantwortet sich natürlich auch die Frage, was der KI-Spaß kosten wird. Wenig überraschend integriert OpenAI Sora gestaffelt in seine bestehenden Abo-Pläne - maximalen Zugriff haben ChatGPT Pro-Kunden, für sie generiert Sora bis zu 20 Sekunden lange Clips in 1080p, pro Monat maximal 500 priorisierte Videos sowie 5 gleichzeitig.
Der Clou aber ist die Möglichkeit, unbegrenzt viele Videos im "relaxed" Modus zu generieren (ähnlich wie bei Midjourney), d.h. man muss - je nach GPU Auslastung und Nutzungshäufigkeit - länger warten, bis die Videos generiert sind. Dieses mit ChatGPT o1 eingeführte Pro-Abo kostet allerdings 200 Dollar monatlich. Hier die detaillierten OpenAI Abo-Preise.
This is wild.
— Min Choi (@minchoi) December 9, 2024
OpenAI just dropped Sora, their state-of-the-art AI video model.
The video quality looks insane.
100% AI, these are not real.
1. 80s Japan Harajuku fashion street pic.twitter.com/Q8xXIbdP4z
Wer dagegen nur ein ChatGPT Plus-Abo hat, bekommt beschränkte Möglichkeiten - nicht nur ist die Auflösung auf 720p reduziert und die Cliplänge auf 5s, die Videos werden wie es scheint beim Download außerdem mit einem Wasserzeichen versehen. Auch gibt es nur 50 priorisierte Video-Generierungen.
Die Sora-Nutzung wird über Credits abgerechnet, sofern nicht "relaxed" generiert wird - Pro-User haben 10.000 Credits pro Monat zur Verfügung, Plus-User 1.000). Je höher die errechnete Qualität und je länger die Dauer, umso mehr Credits werden pro Generierung verbraucht. Im nächsten Jahr will OpenAI nochmals differenziertere Preismodelle bieten. Noch nicht klar ist, ob zusätzliche Credits einzeln erworben werden können.
Funktionen
Unter einer eigenen Bedienoberfläche stehen eine ganze Reihe von Funktionen zur Verfügung. So lassen sich Videos klassisch per Text-Prompt oder auch per Image-to-Video und Video-to-Video generieren. Außerdem bietet Sora auch einige Features, um Usern mehr Kontrolle über ihre Kreationen zu geben. So können neben eigenen, neu generierten auch hochgeladene Clips oder die Kreationen anderer Sora-User nachträglich modifiziert werden. Folgende Funktionen stehen dafür zur Verfügung:
Remix:
- Elemente in Videos lassen sich ersetzen, entfernen oder umgestalten
Re-Cut:
- gelungene Sequenzen lassen sich auswählen und zeitlich erweitern (Vorlauf oder weitere Frames hinzufügen)
Storyboard:
- Abfolgen von verschiedenen Clips können framegenau wie auf einer Timeline gepromptet und zusammengestellt werden
Loop:
- Endlos-Clips lassen sich erstellen indem eine Videosequenzen zugeschnitten und dann von Sora in nahtlos sich wiederholende Clips verwandelt wird
Überblendungen:
- zwei Videos lassen sich übereinander legen und so zu einem Clip zusammenfügen
Stilvorgaben:
- Prompts können wie es scheint als wiederkehrende Style-Presets verwendet werden
Nutzeroberfläche
Sora hat eine eigene, dreigeteilte Nutzeroberfläche: in der linken Spalte kann man die generierten Videos nach verschiedenen Kriterien auswählen, und diese dann im Hauptfenster anzeigen. Unter dem Hauptfenster mit den Videos ist der Composer, ein horizontales Fenster in welchem man per Text-Prompt Videos generieren kann.
Man kann dort zusätzlich Optionen auswählen wie Style-Presets, Aspect Ratio (Seitenverhältnis) , Auflösung (480p, 720p, 1080p), die Cliplänge bestimmen, und die Anzahl der erzeugten Variationen festlegen. Über das Help Icon kann man sich auch anzeigen lassen, wieviele Credits die Generierung verbrauchen wird (abhängig von Auflösung, Seitenverhältnis, Länge und Variationsanzahl). 720p Clips generieren 4x langsamer als 480p Clips, 1080p Videos 8x langsamer.
Das neu generierte Video wird in allen Variationen dann im Hauptfenster angezeigt und bei Maus-Over abgespielt. Wird auf ein Video geklickt, dann wird es in einem neuen Fenster angezeigt, der Lightbox, in welchem es gezielt editiert werden kann. So kann das Prompt oder das zugehörige Storyboard verändert oder der Clip in einer neuen Timeline beschnitten oder verlängert werden (per Extend). Per Prompt läßt sich remixen, um neue Videos zu generieren, die auf dem ausgewählten basieren, eine nahtlose Überblendung zu einem anderen Video hinzufügen oder per Loop eine übergangslose Schleife eines Clip erzeugen.
Sicherheit
Die von Sora erträumten Bewegtbilder werden mit C2PA-Metadaten versehen. Um später feststellen zu können, ob ein Video von Sora stammt, hat OpenAI außerdem ein internes Suchtool entwickelt. Dieses kann zum Abgleich anscheinend auf geloggte, technische Attribute der Generationen zurückgreifen. Und damit Sora nicht für Deepfakes mißbraucht wird, gibt es zunächst nur begrenzte Möglichkeiten, Bilder von Menschen hochzuladen.
Von Usern generierte Sora Clips
sora is launching today to all chatgpt pro and plus users!
— will depue (@willdepue) December 9, 2024
it&s been a big effort to make this possible + i think the product is really fun & intuitive.
my fav thing to do is generate fake historical found footage. video inpainting is also really strong.
have fun! pic.twitter.com/IBHOnNjkxa
🎄 Day 3 of OpenAI&s 12 Days: Sora Launches!
— Jay Prakash Thakur (@jay9thakur) December 9, 2024
Sora turns text, images, or videos into realistic videos , live at https://t.co/DEerxMJlJ7 !
It&s included with your ChatGPT subs.
Key Features:
Remix, Recut, Storyboard, Loop, Blend, Style presets#openai #sora #12daysofopenai pic.twitter.com/0jXzI70qNn
SORA didnt exactly follow my prompt but pretty impressive. The lighting, the look, the movement of the characters/animals, all top tier.
— Jer at EccentrismArt (@EccentrismArt) December 9, 2024
Prompt: cinematic film thousands of years ago during the ice age, five men dressed in dark furs walking on snowy ground, one man is leading a… pic.twitter.com/9ru8BrdeaI
Da ab sofort Millionen von Usern Zugriff auf Sora haben, wird es wohl schnell viele neue Clips und auch Vergleiche mit den chinesischen Top Video-KIs wie Kling 1.5 geben, anhand derer man die Qualität von Sora in allen Situationen einschätzen kann.
Erster Review von Marques Brownlee
Der bekannte Tech-YouTuber Marques Brownlee hatte die Chance, Sora schon vor dem Start ausgiebig zu testen, hier sein Review:
Ihm zufolge hat auch Sora die klassischen Probleme von Video-KIs, zum Beispiel mit der Konsistenz von bewegten Objekten deren Wege sich kreuzen - manche Objekte verschwinden oder tauchen dann plötzlich aus dem Nichts auf, weil Sora sie vergisst, wenn sie durch eine Überlappung kurz nicht auf dem Bild zu sehen sind. Und auch Bewegungen im allgemeinen sind oft fehlerbehaftet - trotz aller Theorie, dass Video-KIs die physikalische Welt simulieren. Die Simulation von Wellen oder Feuer dagegen klappt seiner Erfahrung nach ganz gut.