Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum KI-Forum

Infoseite // Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



Newsmeldung von slashCAM:



OpenAI, die Entwickler unter anderem der Text-KI GPT3 und der Bildgenerierungs KI DALL-E 2 haben das Spracherkennungssystem "Whisper" vorgestellt, welches nicht nur gesp...



Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen


Space


Antwort von freezer:

Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.

Space


Antwort von tom:

freezer hat geschrieben:
Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
Ja genau, die Generierung von Musik ist zum Beispiel ein weiteres Projekt von Stability.ai den Stable Diffusion Entwicklern

Space


Antwort von R S K:

Habe beim „Youtube Whisperer” leider keine Ergebnisse bekommen können (Error) nachdem es sehr lange gedauert hat. Also haben andere wie z.B. Descript, was ich regelmäßig nutze, hinsichtlich Geschwindigkeit (noch) um Längen die Nase vorne. Da habe ich zuletzt über drei Stunden Material in weniger als 5 Minuten Transkribiert bekommen. Premiere ist ähnlich schnell. Wobei Dascript natürlich auch einige sehr spezifische Sonderfunktionen hat, die die meisten aber vermutlich nicht brauchen werden. Aber ich denke sowas wie „Whisper” ist durchaus ein ziemlicher Schlag für solche Geschäftsmodelle! Für die reine Transkription werde ich sie in absehbare Zeit jedenfalls nicht mehr brauchen denke ich.

Space


Antwort von 3Dvideos:

Man sollte dem kostenlosen Tool eine Chance geben. Whisper hat ein 42-Minuten-Video von mir innerhalb von 2 Minuten transkribiert. Zwar sind Fehler vorhanden, aber insgesamt ist der Text schon brauchbar.

Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... Stunden.

Space


Antwort von R S K:

3Dvideos hat geschrieben:
Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... Stunden.
Abgesehen von dem sehr fragwürdigen Deutsch (und das von einem nicht native) ist die Aussage bzgl. Descript „Sie erhalten Ihre Aufgabe(?) innerhalb von nur 24 Stunden” bestenfalls für die (optionale) Transkription von einem Menschen zutreffend, also Unsinn und irrelevant in diesem Zusammenhang. Man kriegt drei Stunden frei und kann es selbst ausprobieren. Das rauf- und runterladen dauert länger als die eigentliche Transkription. Und preislich sind die m.E. auch die besten. Nur übersetzen tun die nicht. Zumindest nicht automatisch.

Ich weiß auch nicht wie es bei den anderen ist, aber bei Descript kann man auch gratis eine bestehende Transkription mit seinem Clip/Audio synchronisieren lassen, zwecks z.B. Ausgabe einer SRT. Die haben auch nette Audio-Visualizer, animierte Untertitel, das ziemlich abgefahrene „Overdub” und mehr.

Space


Antwort von Frank Glencairn:

Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.

Space


Antwort von R S K:

"Frank Glencairn" hat geschrieben:
Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Und wenn man null Interesse an nur halbwegs korrekter Transkription, nicht ein einziges Satzzeichen und das ignorieren sämtlicher Pausen u.v.m. hat—was man dann stundenlang nachbearbeiten darf—auch.

Super Tipp. 👍🏼

Space


Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum KI-Forum

Antworten zu ähnlichen Fragen //


Vegas Pro Update: Unterstützung von ProRes Codecs, Sprache-zu-Text (beta)
Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?
Monitor+: Kostenlose App verwandelt Smartphone in professionellen Vorschau-Monitor für Sony Kameras
Neue freie Meta KI erstellt automatisch Masken für alle Objekte in Fotos oder Videos
Coden für Filmer - welche Sprachen, welche Anwendungen?
Video-Editing per Textkommando: Nach Text-zu-Bild kommt Text-zu-Video
Kostenlose Filme auf VHS oder DVD für Alle? FreeBlockbuster.org
Neue Firmware verwandelt RØDE Wireless GO II Sender in Fieldrecorder
Neue KI stellt Objekte aus Photos automatisch perfekt frei
Suche Filmemacher die Sprache benötigen!
Blackmagic Kamera Update verwandelt Pocket Cinema Camera 4K, 6K in Studio Kameras
Verwandelt iPhone in Webcam: NDI HX Camera App jetzt kostenlos
Olympus OM-D Webcam Beta: kostenloses Tool verwandelt Kameras in Webcams
Effekt-Kette: Compressor =>Sprache oder Musik => Limiter
Canon Zubehör-Kit verwandelt DSLRs und spiegellose Kameras in Webcams
Werbeclip mit Rechten von Dritten (Sprache, Musik, Bild, Videoclip))
1 TB CFexpress für 240 Euro? Adapter verwandelt SSDs in billige CFexpress Typ B Karten
Kostenloses Nvidia KI-Tool: Gesichter einfach per Sprache in Echtzeit animieren




slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash