slashCAM
Administrator
Administrator
Beiträge: 11279

WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von slashCAM »


Im September hatte OpenAI, die Entwickler unter anderem der Text-KI ChatGPT und der Bildgenerierungs-KI DALL-E 2, das Spracherkennungssystem Whisper vorgestellt, welches...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung



Frank Glencairn
Beiträge: 26509

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von Frank Glencairn »

Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Sapere aude - de omnibus dubitandum



holger_1
Beiträge: 88

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von holger_1 »

Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger



cantsin
Beiträge: 16306

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von cantsin »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Ja, aber eben nicht kostenlos, Open Source und auch offline nutzbar.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



j.t.jefferson
Beiträge: 1134

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von j.t.jefferson »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Manfred Baulig



freezer
Beiträge: 3570

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von freezer »

Frank Glencairn hat geschrieben: Mi 01 Feb, 2023 15:25 Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Frank, ich hab hier eine Anleitung der Schritte geschrieben, die bei mir funktioniert haben:
https://forum.blackmagicdesign.com/view ... 09#p906109
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



berlin123
Beiträge: 1249

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von berlin123 »

j.t.jefferson hat geschrieben: Mi 01 Feb, 2023 21:43
holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Fand das Feature in Premiere auch richtig gut. Die Texterkennung war erstaunlicherweise besser, als das was Google im Vergleich produzierte. Aber die Entwicklung in dem Bereich geht ja immer schneller voran.

Da kaum jemand in meinem Team Premiere hat, haben wir letztes Jahr https://www.descript.com verwendet. Anwenderfreundlich und erstellt qualitativ gute Subtitles, die wenig Nacharbeit brauchten.

Inzwischen wurde Descript aber zu einem Video-Editing Tool ausgebaut, was es für mich persönlich eher uninteressanter macht. Aver jetzt sieht ja so aus, dass es im Laufe des Jahres mit WhisperX Technologie eine gute Alternative gibt.



hexeric
Beiträge: 292

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von hexeric »

für WHISPER hat jemand eine feine MAC APP programmiert, die es speziell in der pro version um einmalig 12€ in sich hat: https://goodsnooze.gumroad.com/l/macwhisper
eigentlich braucht man jetzt kaum noch was anderes, spuckt SRT aus, das liest heutzutage alles.



 Aktuelle Beiträge [alle Foren]
 
» UHD Progressive zu HD Interlaced Workflow - Hardware-Lösung für Preview?
von SonyTony - So 13:06
» Kompakte OM-5 Mark II bekommt zwei neue Bildprofile
von cantsin - So 10:25
» Nikon Z5 II mit interner RAW-Aufzeichnung - Debayering, Rolling Shutter und Dynamik
von cantsin - So 9:09
» Film wurde nur mit Handys gedreht...
von Jott - Sa 20:48
» Insta360 Studio - Bildjustagen verschwunden nach update
von soulbrother - Sa 20:09
» Welche USB-C SSD für 4k120 prores am iPhone 16 Pro?
von Totao - Sa 11:43
» Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...
von Totao - Sa 11:38
» Kleines Schwanenhalsmikro für AVX-Bodypacksenser gesucht
von pillepalle - Fr 16:04
» Magix Video deluxe 2026 und Video Pro X17 mit neuen KI-Funktionen
von slashCAM - Fr 11:45
» Nanlite FM Mount Projektionsaufsatz 18°-36° für präzise Lichtgestaltung
von Darth Schneider - Fr 11:20
» Adobe Firefly jetzt als Smartphone-App - samt Nutzung von Veo 3, Luma und Pika
von peter161170 - Fr 9:14
» Sony FX2 im Praxistest: Erstmalig neigbarer Sucher, Cine-Gehäuse wie FX3, 33 MP Fullframe CMOS
von pillepalle - Fr 7:18
» Panasonic S1RII im Praxistest: Überraschend viele Videofunktionen für Pros
von iasi - Fr 0:18
» Blackmagic Updates für Web Presenter, Video Assist, Cloud und BRAW
von slashCAM - Do 11:27
» Adobe Premiere Pro ab sofort mit 4:2:2 Beschleunigung per Nvidia GPU und mehr
von dienstag_01 - Do 11:03
» Superman | Offizieller Trailer
von 7River - Do 5:11
» Midjourney startet eigene Video-KI V1
von slashCAM - Do 1:09
» DJI RS4 Pro und LiDAR: Bestes AF/Tracking (inkl. Stabilisierung) für Cine-Setups?
von pillepalle - Mi 23:45
» Sigma 17-40mm F1.8 DC | Art für APS-C vorgestellt u.a. mit RF-Mount
von iasi - Mi 23:24
» SIRUI Reparaturen/Customer Service Germany
von gizmotronic - Mi 18:47
» RS4 mit XR AR Brillen als Videomonitor möglich?
von Silentsnoop - Mi 18:45
» Sony Alpha 6700 S-Cinetone überbelichtet
von cantsin - Mi 18:02
» Fujifilm X-E5 vorgestellt mit 40MP, IBIS, 6,2K Video - und deutlich teurer
von cantsin - Mi 14:07
» DaVinci Resolve 18 +++ Projekt.db wird nicht erkannt
von Jasper - Mi 11:39
» Verständnisfrage: MOV/MP4 H.264/H.265 Formate der S5/S5II für die Bearbeitung mit neuer Grafikkarte B580 (H.265 Decode)
von blueplanet - Mi 11:37
» Deutsche Redakteure austricksen! mit JOSEPH BOLZ
von Nigma1313 - Mi 11:08
» Sony FX2 Sensor-Bildqualität - Debayering, Rolling Shutter und Dynamik
von Alex - Mi 7:25
» 3 Audios bei einem Dreh WIE?
von Blackbox - Di 21:56
» Mocha Pro 2025.5 Update mit Facetracking, neuem 3D-Snap-Tool und mehr
von freezer - Di 19:29
» Kommt N-Log2 demnächst in Nikon Z9 / Z8 / Z6III / ZF Kameras?
von stip - Di 13:57
» Software zur Kamera HDC-SD600
von MLJ - Di 11:13
» KI-Werbespot für 2.000 Dollar im GTA Stil läuft zur TV-Hauptsendezeit
von 7River - Di 7:04
» RUHE bewahren am Set - Mit Shawn Bu
von Nigma1313 - Di 0:53
» NoScribe
von beiti - Mo 21:04
» Meta bietet kostenlose KI-Videoeffekte (VFX) an
von iasi - Mo 19:16