KI Forum



Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



Alles rund um KIs (DeepLearning), Algorithmen für spezielle Effekte, zur Generierung von Bildern und Videos und mehr
Antworten
slashCAM
Administrator
Administrator
Beiträge: 11279

Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von slashCAM »


OpenAI, die Entwickler unter anderem der Text-KI GPT3 und der Bildgenerierungs KI DALL-E 2 haben das Spracherkennungssystem "Whisper" vorgestellt, welches nicht nur gesp...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen



freezer
Beiträge: 3570

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von freezer »

Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



tom
Administrator
Administrator
Beiträge: 1518

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von tom »

freezer hat geschrieben: Mo 26 Sep, 2022 15:56 Der nächste logische Schritt wäre nun typische Stockmusic-Stücke per AI generieren zu lassen - das wäre dann das Ende von Premiumbeat und Co.
Ja genau, die Generierung von Musik ist zum Beispiel ein weiteres Projekt von Stability.ai den Stable Diffusion Entwicklern
slashCAM



R S K
Beiträge: 2340

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

Habe beim „Youtube Whisperer” leider keine Ergebnisse bekommen können (Error) nachdem es sehr lange gedauert hat. Also haben andere wie z.B. Descript, was ich regelmäßig nutze, hinsichtlich Geschwindigkeit (noch) um Längen die Nase vorne. Da habe ich zuletzt über drei Stunden Material in weniger als 5 Minuten Transkribiert bekommen. Premiere ist ähnlich schnell. Wobei Dascript natürlich auch einige sehr spezifische Sonderfunktionen hat, die die meisten aber vermutlich nicht brauchen werden. Aber ich denke sowas wie „Whisper” ist durchaus ein ziemlicher Schlag für solche Geschäftsmodelle! Für die reine Transkription werde ich sie in absehbare Zeit jedenfalls nicht mehr brauchen denke ich.



3Dvideos
Beiträge: 805

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von 3Dvideos »

Man sollte dem kostenlosen Tool eine Chance geben. Whisper hat ein 42-Minuten-Video von mir innerhalb von 2 Minuten transkribiert. Zwar sind Fehler vorhanden, aber insgesamt ist der Text schon brauchbar.

Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... %20Stunden.



R S K
Beiträge: 2340

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

3Dvideos hat geschrieben: Do 29 Sep, 2022 17:23Wer Geld ausgeben möchte oder auch nur eine simple Hilfe zum Transkribieren benötigt, findet hier mehr:

https://geekflare.com/de/best-transcrip ... %20Stunden.
Abgesehen von dem sehr fragwürdigen Deutsch (und das von einem nicht native) ist die Aussage bzgl. Descript „Sie erhalten Ihre Aufgabe(?) innerhalb von nur 24 Stunden” bestenfalls für die (optionale) Transkription von einem Menschen zutreffend, also Unsinn und irrelevant in diesem Zusammenhang. Man kriegt drei Stunden frei und kann es selbst ausprobieren. Das rauf- und runterladen dauert länger als die eigentliche Transkription. Und preislich sind die m.E. auch die besten. Nur übersetzen tun die nicht. Zumindest nicht automatisch.

Ich weiß auch nicht wie es bei den anderen ist, aber bei Descript kann man auch gratis eine bestehende Transkription mit seinem Clip/Audio synchronisieren lassen, zwecks z.B. Ausgabe einer SRT. Die haben auch nette Audio-Visualizer, animierte Untertitel, das ziemlich abgefahrene „Overdub” und mehr.



Frank Glencairn
Beiträge: 26509

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von Frank Glencairn »

Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Sapere aude - de omnibus dubitandum



R S K
Beiträge: 2340

Re: Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in alle Sprachen

Beitrag von R S K »

Frank Glencairn hat geschrieben: Fr 30 Sep, 2022 12:07Wenn's nicht eilt, kann man ein Video auch einfach auf YT hochladen, und dann das fertige Transcript wieder runter landen.
Und wenn man null Interesse an nur halbwegs korrekter Transkription, nicht ein einziges Satzzeichen und das ignorieren sämtlicher Pausen u.v.m. hat—was man dann stundenlang nachbearbeiten darf—auch.

Super Tipp. 👍🏼



 Aktuelle Beiträge [alle Foren]
 
» Bildsensor mit Perowskit verdreifacht mögliche Auflösung
von CotORR - Di 8:48
» 36% mehr DSLMs ausgeliefert im April als im Vorjahr
von iasi - Mo 23:00
» Neuer XAVC-L Standard für ARD/ZDF – Interlacing noch Thema?
von vaio - Mo 21:26
» Higgsfield.ai - Aufwändige Videoeffekte auf Knopfdruck aus der KI-Cloud
von Drushba - Mo 18:34
» Manueller Video Modus nicht mehr erreichbar.
von milesdavis - Mo 15:45
» Rode Wireless Go 3 - Ton zu leise
von rush - Mo 10:49
» BM Micro Studio Camera G2 erhält Pyxis Monitor Kompatibelität
von Darth Schneider - Mo 9:19
» Suche Omnidirektionales Mikrofon-Setup für Sony FX3
von pillepalle - Mo 6:25
» Unzuverlässiger Autofokus HC-X2E
von Jott - So 20:39
» UHD Progressive zu HD Interlaced Workflow - Hardware-Lösung für Preview?
von SonyTony - So 13:06
» Kompakte OM-5 Mark II bekommt zwei neue Bildprofile
von cantsin - So 10:25
» Nikon Z5 II mit interner RAW-Aufzeichnung - Debayering, Rolling Shutter und Dynamik
von cantsin - So 9:09
» Film wurde nur mit Handys gedreht...
von Jott - Sa 20:48
» Insta360 Studio - Bildjustagen verschwunden nach update
von soulbrother - Sa 20:09
» Welche USB-C SSD für 4k120 prores am iPhone 16 Pro?
von Totao - Sa 11:43
» Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...
von Totao - Sa 11:38
» Kleines Schwanenhalsmikro für AVX-Bodypacksenser gesucht
von pillepalle - Fr 16:04
» Magix Video deluxe 2026 und Video Pro X17 mit neuen KI-Funktionen
von slashCAM - Fr 11:45
» Nanlite FM Mount Projektionsaufsatz 18°-36° für präzise Lichtgestaltung
von Darth Schneider - Fr 11:20
» Adobe Firefly jetzt als Smartphone-App - samt Nutzung von Veo 3, Luma und Pika
von peter161170 - Fr 9:14
» Sony FX2 im Praxistest: Erstmalig neigbarer Sucher, Cine-Gehäuse wie FX3, 33 MP Fullframe CMOS
von pillepalle - Fr 7:18
» Panasonic S1RII im Praxistest: Überraschend viele Videofunktionen für Pros
von iasi - Fr 0:18
» Blackmagic Updates für Web Presenter, Video Assist, Cloud und BRAW
von slashCAM - Do 11:27
» Adobe Premiere Pro ab sofort mit 4:2:2 Beschleunigung per Nvidia GPU und mehr
von dienstag_01 - Do 11:03
» Superman | Offizieller Trailer
von 7River - Do 5:11
» Midjourney startet eigene Video-KI V1
von slashCAM - Do 1:09
» DJI RS4 Pro und LiDAR: Bestes AF/Tracking (inkl. Stabilisierung) für Cine-Setups?
von pillepalle - Mi 23:45
» Sigma 17-40mm F1.8 DC | Art für APS-C vorgestellt u.a. mit RF-Mount
von iasi - Mi 23:24
» SIRUI Reparaturen/Customer Service Germany
von gizmotronic - Mi 18:47
» RS4 mit XR AR Brillen als Videomonitor möglich?
von Silentsnoop - Mi 18:45
» Sony Alpha 6700 S-Cinetone überbelichtet
von cantsin - Mi 18:02
» Fujifilm X-E5 vorgestellt mit 40MP, IBIS, 6,2K Video - und deutlich teurer
von cantsin - Mi 14:07
» DaVinci Resolve 18 +++ Projekt.db wird nicht erkannt
von Jasper - Mi 11:39
» Verständnisfrage: MOV/MP4 H.264/H.265 Formate der S5/S5II für die Bearbeitung mit neuer Grafikkarte B580 (H.265 Decode)
von blueplanet - Mi 11:37
» Deutsche Redakteure austricksen! mit JOSEPH BOLZ
von Nigma1313 - Mi 11:08