KI Forum



Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



Alles rund um KIs (DeepLearning), Algorithmen für spezielle Effekte, zur Generierung von Bildern und Videos und mehr
Antworten
slashCAM
Administrator
Administrator
Beiträge: 11279

Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von slashCAM »


OpenAI, die Entwickler unter anderem der Text-KI GPT3 und der Bildgenerierungs KI DALL-E 2 haben das Spracherkennungssystem "Whisper" vorgestellt, welches nicht nur gesp...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



freezer
Beiträge: 3680

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von freezer »

Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



tom
Administrator
Administrator
Beiträge: 1542

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von tom »

freezer hat geschrieben: Mo 26 Sep, 2022 15:56 Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
Ja genau, die Generierung von Musik ist zum Beispiel ein weiteres Projekt von Stability.ai den Stable Diffusion Entwicklern
slashCAM



R S K
Beiträge: 2352

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

Habe beim „Youtube Whisperer” leider keine Ergebnisse bekommen können (Error) nachdem es sehr lange gedauert hat. Also haben andere wie z.B. Descript, was ich regelmäßig nutze, hinsichtlich Geschwindigkeit (noch) um Längen die Nase vorne. Da habe ich zuletzt über drei Stunden Material in weniger als 5 Minuten Transkribiert bekommen. Premiere ist ähnlich schnell. Wobei Dascript natürlich auch einige sehr spezifische Sonderfunktionen hat, die die meisten aber vermutlich nicht brauchen werden. Aber ich denke sowas wie „Whisper” ist durchaus ein ziemlicher Schlag für solche Geschäftsmodelle! Für die reine Transkription werde ich sie in absehbare Zeit jedenfalls nicht mehr brauchen denke ich.



3Dvideos
Beiträge: 805

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von 3Dvideos »

Man sollte dem kostenlosen Tool eine Chance geben. Whisper hat ein 42-Minuten-Video von mir innerhalb von 2 Minuten transkribiert. Zwar sind Fehler vorhanden, aber insgesamt ist der Text schon brauchbar.

Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... %20Stunden.



R S K
Beiträge: 2352

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

3Dvideos hat geschrieben: Do 29 Sep, 2022 17:23Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... %20Stunden.
Abgesehen von dem sehr fragwürdigen Deutsch (und das von einem nicht native) ist die Aussage bzgl. Descript „Sie erhalten Ihre Aufgabe(?) innerhalb von nur 24 Stunden” bestenfalls für die (optionale) Transkription von einem Menschen zutreffend, also Unsinn und irrelevant in diesem Zusammenhang. Man kriegt drei Stunden frei und kann es selbst ausprobieren. Das rauf- und runterladen dauert länger als die eigentliche Transkription. Und preislich sind die m.E. auch die besten. Nur übersetzen tun die nicht. Zumindest nicht automatisch.

Ich weiß auch nicht wie es bei den anderen ist, aber bei Descript kann man auch gratis eine bestehende Transkription mit seinem Clip/Audio synchronisieren lassen, zwecks z.B. Ausgabe einer SRT. Die haben auch nette Audio-Visualizer, animierte Untertitel, das ziemlich abgefahrene „Overdub” und mehr.



Frank Glencairn
Beiträge: 26509

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von Frank Glencairn »

Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Sapere aude - de omnibus dubitandum



R S K
Beiträge: 2352

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

Frank Glencairn hat geschrieben: Fr 30 Sep, 2022 12:07Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Und wenn man null Interesse an nur halbwegs korrekter Transkription, nicht ein einziges Satzzeichen und das ignorieren sämtlicher Pausen u.v.m. hat—was man dann stundenlang nachbearbeiten darf—auch.

Super Tipp. 👍🏼



 Aktuelle Beiträge [alle Foren]
 
» Autofokus-Einstellungen Panasonic S5II/IIX/S9
von ksingle - Di 11:14
» Meike und Viltrox mit neuen 85mm Portrait-Telebrennweiten
von GaToR-BN - Di 10:38
» Kathryn Bigelows "A House of Dynamite" - das ist mal was.
von Alex - Di 8:41
» Hackermovies.de schliesst seine Pforten
von Jan - Mo 0:59
» Voigtländer Apo Lanthar 28mm f2 Aspherical
von Rick SSon - Mo 0:59
» DJI Mini 4 Pro Fly More Combo mit RC-N2
von v-empire - So 22:14
» Videonale 2025, Kurzfilmabend
von erwinvideo - So 18:49
» Juan Melara FilmUnlimited
von Axel - So 12:58
» Portkeys LH5C - 800 Nits und Kamerasteuerung für 222 Euro
von slashCAM - So 10:24
» Apple plant OLED-MacBook Pro, Mac Studio M6 Ultra und Mini-LED Studio Display
von Da_Michl - So 9:05
» Panasonic beendet LUMIX PRO Service
von Da_Michl - So 7:33
» SanDisk stellt Extreme Fit vor: Aktuell kleinster 1TB USB-C-Speicherstick
von Jott - Sa 19:51
» RØDECaster Video S: Kompakte Produktionskonsole für Video und Audio
von Darth Schneider - Sa 9:52
» Mit Filmen GELD verdienen (Filminvests): Mit UWE BOLL
von 7River - Fr 18:12
» HONORARE & HONORARGRÖßEN im Film: Mit Florian Tessloff
von Nigma1313 - Fr 13:15
» Canon EOS C50 im Praxistest: Kompaktes Arbeitstier mit 7K 50p Raw - die neue FX3 Konkurrenz
von Rick SSon - Fr 12:43
» Alien: Romulus - Teaser Trailer online - produziert von Ridley Scott, gedreht auf Alexa 35
von Jott - Fr 6:37
» Sony FX3 Nachfolger: Wie wichtig ist Open Gate wenn ein elektronisch verstellbarer ND Filter möglich wäre?
von Mikkel - Fr 1:42
» Linsen (Vintage, Anamorphic & Co.)
von Funless - Do 17:13
» Nikon ZR Lesertester gesucht! Nikon ZR zu gewinnen
von j.t.jefferson - Do 14:21
» DJI Neo 2: Kompakte Selfie-/FPV-Drohne mit Rundum-Hinderniserkennung und 4K/100p
von slashCAM - Do 13:36
» Behind the Scenes - Gute Sammlung
von iasi - Do 10:08
» Täglich über 15 Millionen US-Dollar Verlust? Sora 2 kommt OpenAI teuer zu stehen
von iasi - Mi 21:38
» ARRI Film Lab: Bewährte Color Science als OpenFX-Plugin
von Darth Schneider - Mi 19:23
» Sony Xperia VII und FX3 / FX6
von j.t.jefferson - Mi 18:09
» Synchronisation mehrerer Kameras mit Unterbrechungen
von j.t.jefferson - Mi 16:17
» Datacolor SpyderX Pro unterstützt jetzt 3D-LUTs und Content Credentials
von dienstag_01 - Mi 12:09
» Das Audio ducking will nicht funktionieren
von Aloha - Mi 9:09
» ARRI Film Lab
von Clemens Schiesko - Di 23:07
» Middle Control 3.0 - Sony Kameras via ATEM steuern
von rush - Di 22:08
» Canon EOS R6 Mark III mit 32,5 MP-Sensor, 7K Raw 50/60p und Open Gate Aufnahme vorgestellt
von roki100 - Di 20:52
» Orbsmart R82 mit ZDMC AnzeigeWerbung
von Nvidia 3D - Di 18:17
» Neues Apple TV Intro - Logo aus Glas statt KI und CGI
von Darth Schneider - Di 16:03
» Frankenstein
von Darth Schneider - Di 7:21
» DJI Avata 360 - Leaks zeigen DJIs neue 360°-Drohne
von slashCAM - Mo 22:33