Während die meisten KI-generierten Videos (noch) Stummfilmchen sind, prescht Pika weiter voran - seit etwa 2 Wochen lassen sich dort erstellten KI-Figuren (nicht wirklich) lippensynchron Worte in den Mund legen Dank einer Integration mit Elevenlabs. Nun folgt die Ankündigung von Sound Effects direkt in Pika. Auch diese dürfte wohl wieder auf eine Zusammenarbeit mit Elevenlabs zurückgehen, schließlich hatte das Unternehmen erst neulich bekanntgegeben, an just KI Sound-Effekten zu arbeiten.
Während in dem Zusammenhang jedoch nur von Text-zu-SoundFX die Rede war, lag es nah bei der Hand, eine native Verknüpfung mit KI-generierten Bildern zu erwarten, und diese will nun also Pika als erstes bieten. Und zwar soll sich Audio nahtlos generieren und integrieren lassen, entweder per Prompt oder ganz automatisch basierend auf die Bildinhalte. Im Beispielvideo klingt das wie folgt:
…Sorry, we were on mute. Today we’re launching Sound Effects on Pika.
— Pika (@pika_labs) March 9, 2024
Now you can seamlessly generate and integrate sound into your videos. Either prompt the sound you want, or let Pika automatically generate it based on the content of your video.
If that sounds great, it’s… pic.twitter.com/975ThEhZke
Die neuen Sound-Optionen sollen "Super-Kollaboratoren" und Pro-Usern bereits zur Verfügung stehen und demnächst für alle freigeschaltet werden. Ob durch die Tongenerierung zusätzliche Kosten anfallen, dazu gibt es noch keine Angaben - Lip Sync etwa ist kostenlos für zahlende Abonnenten, während für Nutzer des Gratis-Accounts pro Spracherstellung 2 Credits anfallen.