KI Forum



Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



Alles rund um KIs (DeepLearning), Algorithmen für spezielle Effekte, zur Generierung von Bildern und Videos und mehr
Antworten
slashCAM
Administrator
Administrator
Beiträge: 11262

Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von slashCAM »


OpenAI, die Entwickler unter anderem der Text-KI GPT3 und der Bildgenerierungs KI DALL-E 2 haben das Spracherkennungssystem "Whisper" vorgestellt, welches nicht nur gesp...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



freezer
Beiträge: 3280

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von freezer »

Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



tom
Administrator
Administrator
Beiträge: 1487

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von tom »

freezer hat geschrieben: Mo 26 Sep, 2022 15:56 Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
Ja genau, die Generierung von Musik ist zum Beispiel ein weiteres Projekt von Stability.ai den Stable Diffusion Entwicklern
slashCAM



R S K
Beiträge: 2279

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

Habe beim „Youtube Whisperer” leider keine Ergebnisse bekommen können (Error) nachdem es sehr lange gedauert hat. Also haben andere wie z.B. Descript, was ich regelmäßig nutze, hinsichtlich Geschwindigkeit (noch) um Längen die Nase vorne. Da habe ich zuletzt über drei Stunden Material in weniger als 5 Minuten Transkribiert bekommen. Premiere ist ähnlich schnell. Wobei Dascript natürlich auch einige sehr spezifische Sonderfunktionen hat, die die meisten aber vermutlich nicht brauchen werden. Aber ich denke sowas wie „Whisper” ist durchaus ein ziemlicher Schlag für solche Geschäftsmodelle! Für die reine Transkription werde ich sie in absehbare Zeit jedenfalls nicht mehr brauchen denke ich.



3Dvideos
Beiträge: 805

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von 3Dvideos »

Man sollte dem kostenlosen Tool eine Chance geben. Whisper hat ein 42-Minuten-Video von mir innerhalb von 2 Minuten transkribiert. Zwar sind Fehler vorhanden, aber insgesamt ist der Text schon brauchbar.

Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... %20Stunden.



R S K
Beiträge: 2279

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

3Dvideos hat geschrieben: Do 29 Sep, 2022 17:23Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... %20Stunden.
Abgesehen von dem sehr fragwürdigen Deutsch (und das von einem nicht native) ist die Aussage bzgl. Descript „Sie erhalten Ihre Aufgabe(?) innerhalb von nur 24 Stunden” bestenfalls für die (optionale) Transkription von einem Menschen zutreffend, also Unsinn und irrelevant in diesem Zusammenhang. Man kriegt drei Stunden frei und kann es selbst ausprobieren. Das rauf- und runterladen dauert länger als die eigentliche Transkription. Und preislich sind die m.E. auch die besten. Nur übersetzen tun die nicht. Zumindest nicht automatisch.

Ich weiß auch nicht wie es bei den anderen ist, aber bei Descript kann man auch gratis eine bestehende Transkription mit seinem Clip/Audio synchronisieren lassen, zwecks z.B. Ausgabe einer SRT. Die haben auch nette Audio-Visualizer, animierte Untertitel, das ziemlich abgefahrene „Overdub” und mehr.



Frank Glencairn
Beiträge: 23075

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von Frank Glencairn »

Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Sapere aude - de omnibus dubitandum



R S K
Beiträge: 2279

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

Frank Glencairn hat geschrieben: Fr 30 Sep, 2022 12:07Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Und wenn man null Interesse an nur halbwegs korrekter Transkription, nicht ein einziges Satzzeichen und das ignorieren sämtlicher Pausen u.v.m. hat—was man dann stundenlang nachbearbeiten darf—auch.

Super Tipp. 👍🏼



 Aktuelle Beiträge [alle Foren]
 
» NAB 2024 Neuigkeiten
von pillepalle - Do 0:24
» Linsen (Vintage, Anamorphic & Co.)
von Skeptiker - Do 0:10
» Was schaust Du gerade?
von klusterdegenerierung - Mi 23:44
» Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.
von roki100 - Mi 23:15
» Was hörst Du gerade?
von klusterdegenerierung - Mi 23:14
» Tieraufnahmen mit dem MKE600 + H1 Essential rauschen
von Skeptiker - Mi 23:06
» Messevideo: Atomos NINJA PHONE erklärt
von rob - Mi 22:39
» Was hast Du zuletzt gekauft?
von Jörg - Mi 22:08
» Blackmagic Box Camera
von roki100 - Mi 20:31
» Western Digital Ultrastar Transporter: 368 TB in der Aktentasche
von medienonkel - Mi 19:44
» GPS Receiver GP-E2 Standort anzeigen
von Reinhold888 - Mi 17:32
» Western Digital stellt weltweit erste 4 TB SD-Karte vor
von Walter Schulz - Mi 16:43
» Insta360 X4 360°-Action-Kamera filmt in 8K
von Achim KCW - Mi 16:13
» Blackmagic URSA Cine 12K - 16 Blendenstufen für 15.000 Dollar!
von Frank Glencairn - Mi 15:33
» Netflix „Ripley“
von TomStg - Mi 13:17
» Adobe entfernt negativ promts
von klusterdegenerierung - Mi 12:09
» Tragischer Unfall am Set trotz Filmwaffe: Kamerafrau stirbt nach Schuß von Alec Baldwin
von 7River - Mi 11:23
» Dehancer Pro - Filmsimulation auf höchstem Niveau
von Frank Glencairn - Mi 10:19
» Blackmagic DaVinci Resolve 19 jetzt auch auf Deutsch
von medienonkel - Mi 9:58
» DJI Avata 2, Goggles 3 und RC Motion 3 im ersten Praxistest
von Videopower - Di 23:35
» RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt
von iasi - Di 23:24
» ASUS ProArt PA32KCX - 8K Mini-LED-Monitor mit DisplayPort 2.1
von MK - Di 20:22
» Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor
von patfish - Di 19:57
» Neues Blackmagic DaVinci Resolve 19 bringt über 100 neue Funktionen
von MK - Di 19:23
» Videointerview: Die neue Blackmagic PIXIS 6K Box Kamera erklärt
von iasi - Di 18:42
» Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition
von klusterdegenerierung - Di 16:47
» Welches Highclass Smartphone für gute BTS-Video?
von Frank Glencairn - Di 16:09
» !Großes Serien update bei Samyang!
von Bildlauf - Di 15:54
» Videointerview: Adobe Premiere Pro - die neuen KI Funktionen erklärt
von slashCAM - Di 15:42
» ARRI zeigt Multicam-System ALEXA 35 Live
von slashCAM - Di 14:45
» Neues Ärzte-Musikvideo schafft durchgehende Konsistenz mittels KI-Stil
von februarfinal8 - Di 14:31
» Blackmagic senkt Preise für alle Video Assist 3G- und 12G-Monitor-Recorder
von roki100 - Di 12:49
» Apple Vision Pro: Verkaufsstart (USA) ab Februar für 3.499,- Dollar + neuer Werbeclip
von NurlLeser - Di 9:36
» ZOOM F6 - 32 Bit Audio Recorder
von berlin123 - Mo 21:50
» Die URSA Cine 17K soll mit 50mm breitem Sensor kommen
von iasi - Mo 21:13