KI Forum



Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



Alles rund um KIs (DeepLearning), Algorithmen für spezielle Effekte, zur Generierung von Bildern und Videos und mehr
Antworten
slashCAM
Administrator
Administrator
Beiträge: 11279

Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von slashCAM »


OpenAI, die Entwickler unter anderem der Text-KI GPT3 und der Bildgenerierungs KI DALL-E 2 haben das Spracherkennungssystem "Whisper" vorgestellt, welches nicht nur gesp...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



freezer
Beiträge: 3853

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von freezer »

Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



tom
Administrator
Administrator
Beiträge: 1567

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von tom »

freezer hat geschrieben: Mo 26 Sep, 2022 15:56 Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
Ja genau, die Generierung von Musik ist zum Beispiel ein weiteres Projekt von Stability.ai den Stable Diffusion Entwicklern
slashCAM



R S K
Beiträge: 2397

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

Habe beim „Youtube Whisperer” leider keine Ergebnisse bekommen können (Error) nachdem es sehr lange gedauert hat. Also haben andere wie z.B. Descript, was ich regelmäßig nutze, hinsichtlich Geschwindigkeit (noch) um Längen die Nase vorne. Da habe ich zuletzt über drei Stunden Material in weniger als 5 Minuten Transkribiert bekommen. Premiere ist ähnlich schnell. Wobei Dascript natürlich auch einige sehr spezifische Sonderfunktionen hat, die die meisten aber vermutlich nicht brauchen werden. Aber ich denke sowas wie „Whisper” ist durchaus ein ziemlicher Schlag für solche Geschäftsmodelle! Für die reine Transkription werde ich sie in absehbare Zeit jedenfalls nicht mehr brauchen denke ich.



3Dvideos
Beiträge: 805

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von 3Dvideos »

Man sollte dem kostenlosen Tool eine Chance geben. Whisper hat ein 42-Minuten-Video von mir innerhalb von 2 Minuten transkribiert. Zwar sind Fehler vorhanden, aber insgesamt ist der Text schon brauchbar.

Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... %20Stunden.



R S K
Beiträge: 2397

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

3Dvideos hat geschrieben: Do 29 Sep, 2022 17:23Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... %20Stunden.
Abgesehen von dem sehr fragwürdigen Deutsch (und das von einem nicht native) ist die Aussage bzgl. Descript „Sie erhalten Ihre Aufgabe(?) innerhalb von nur 24 Stunden” bestenfalls für die (optionale) Transkription von einem Menschen zutreffend, also Unsinn und irrelevant in diesem Zusammenhang. Man kriegt drei Stunden frei und kann es selbst ausprobieren. Das rauf- und runterladen dauert länger als die eigentliche Transkription. Und preislich sind die m.E. auch die besten. Nur übersetzen tun die nicht. Zumindest nicht automatisch.

Ich weiß auch nicht wie es bei den anderen ist, aber bei Descript kann man auch gratis eine bestehende Transkription mit seinem Clip/Audio synchronisieren lassen, zwecks z.B. Ausgabe einer SRT. Die haben auch nette Audio-Visualizer, animierte Untertitel, das ziemlich abgefahrene „Overdub” und mehr.



Frank Glencairn
Beiträge: 26509

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von Frank Glencairn »

Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Sapere aude - de omnibus dubitandum



R S K
Beiträge: 2397

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

Frank Glencairn hat geschrieben: Fr 30 Sep, 2022 12:07Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Und wenn man null Interesse an nur halbwegs korrekter Transkription, nicht ein einziges Satzzeichen und das ignorieren sämtlicher Pausen u.v.m. hat—was man dann stundenlang nachbearbeiten darf—auch.

Super Tipp. 👍🏼



 Aktuelle Beiträge [alle Foren]
 
» Adobe bringt kostenlose Profi-Kamera App mit KI-Funktionen
von vaio - Fr 3:49
» Neue Umfrage: Welche Speicherlösung nutzt Du primär für Videodaten?
von soulbrother - Do 22:25
» EIZO ColorEdge CS3200X - 31,5" 4K-Monitor mit Profi-Features der CG-Serie
von CameraRick - Do 16:13
» Neues aus der Welt BMD + Apple Immersive Video
von R S K - Do 15:32
» Netflix VOID – neues kostenloses KI-Tool zum Entfernen von Objekten aus Videos
von MaxSchreck - Do 14:55
» Rückprojektion mit einem Ultrakurzdistanz Beamer
von asymmetric - Do 14:52
» CornerCut - direkter Timeline-Export ohne XML
von CameraRick - Do 13:59
» Audiorecorder Mikrofone Tascam FR AV-2, Lewitt, Synco
von KeineCloud - Mi 17:17
» Tascam DR-40XP - verbesserter 4-Spur-Audiorecorder
von slashCAM - Mi 16:18
» Blackmagic DeckLink IP 100G vorgestellt - 8 Kanal 4K Capturing und Playback per Ethernet
von slashCAM - Mi 14:48
» Die Filmindustrie ist zur Zeit schwierig - ANDREA LAMBSDORFF
von Nigma1313 - Mi 13:23
» Verkaufe Davinci Resolve Studio
von Jost - Mi 8:12
» Offener Brief gegen KI-Slop für Kinder auf YouTube
von j.t.jefferson - Mi 3:33
» Empfehlung gesucht: Bluetooth-Kopfhörer als Zweitmonitor
von Hifi - Di 12:51
» Sigma FF High Speed Cine Prime Set (PL-Mount) – T1.5 – 20/35/50/85mm – Top Zustand
von beesandrockets - Di 12:45
» Wir können SO nicht weitermachen! | MASTERCUT
von Nigma1313 - Di 12:34
» Weltweiter Launch von Seedance 2.0 verspätet sich nach Copyright-Aufschrei
von iasi - Mo 22:27
» Erfahrung mit MAMIYA Objektive?
von RonMarKom - Mo 19:53
» Pokalsieger Highlight Video DEVOTION
von Christian 671 - Mo 9:02
» TelTec zu empfehlen (Insolvenz)
von Pianist - So 21:18
» DIY Heltec LoRa32 V3 Spielereien
von ruessel - So 16:09
» h264 Lizenzkosten explodieren für Streaming-Anbieter
von Darth Schneider - So 14:14
» KEP59 Musikvideo mein Leben auf dem Rücksitz
von Heinrich123 - So 9:00
» Klatschen und Pfeifen aus einer mp3 entfernen
von Samir - Sa 17:52
» Sichtbarer Unterschied zwischen 4:2:2 und 4:2:0
von Jott - Sa 16:34
» Frühjahrsputz - Überflüssige Dateien unter macOS systematisch finden und löschen
von TomWI - Sa 10:39
» Sound Devices Astral Mini Plus: Kompakter Sender für Profis mit ePaper-Display
von slashCAM - Sa 10:36
» Apple M5 und M5 Max im MacBook Air und Pro - Performance unter DaVinci Resolve
von rush - Fr 19:42
» Das Ende einer Ära - Apple Mac Studio ersetzt Mac Pro endgültig
von Darth Schneider - Fr 18:29
» Schauspieler am Filmset! KAIS SETTI
von Darth Schneider - Fr 12:44
» Welche Sony A7 für längere 4K Aufnahmen?
von hexeric - Fr 9:51
» Rushes will das neue Vimeo werden
von rush - Do 16:34
» Europäischen audiovisuellen Sektor auf 142 Mrd. € geschätzt.
von ruessel - Do 15:30
» Datacolor Spyder-Frühlingsaktion - bis zu 100€ Rabatt auf Farbkalibrierungslösungen
von slashCAM - Do 10:03
» DUNE !
von markusG - Mi 20:51