slashCAM
Administrator
Administrator
Beiträge: 11279

WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von slashCAM »


Im September hatte OpenAI, die Entwickler unter anderem der Text-KI ChatGPT und der Bildgenerierungs-KI DALL-E 2, das Spracherkennungssystem Whisper vorgestellt, welches...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung



Frank Glencairn
Beiträge: 26509

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von Frank Glencairn »

Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Sapere aude - de omnibus dubitandum



holger_1
Beiträge: 88

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von holger_1 »

Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger



cantsin
Beiträge: 16521

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von cantsin »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Ja, aber eben nicht kostenlos, Open Source und auch offline nutzbar.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



j.t.jefferson
Beiträge: 1153

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von j.t.jefferson »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Manfred Baulig



freezer
Beiträge: 3596

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von freezer »

Frank Glencairn hat geschrieben: Mi 01 Feb, 2023 15:25 Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Frank, ich hab hier eine Anleitung der Schritte geschrieben, die bei mir funktioniert haben:
https://forum.blackmagicdesign.com/view ... 09#p906109
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



berlin123
Beiträge: 1279

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von berlin123 »

j.t.jefferson hat geschrieben: Mi 01 Feb, 2023 21:43
holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Fand das Feature in Premiere auch richtig gut. Die Texterkennung war erstaunlicherweise besser, als das was Google im Vergleich produzierte. Aber die Entwicklung in dem Bereich geht ja immer schneller voran.

Da kaum jemand in meinem Team Premiere hat, haben wir letztes Jahr https://www.descript.com verwendet. Anwenderfreundlich und erstellt qualitativ gute Subtitles, die wenig Nacharbeit brauchten.

Inzwischen wurde Descript aber zu einem Video-Editing Tool ausgebaut, was es für mich persönlich eher uninteressanter macht. Aver jetzt sieht ja so aus, dass es im Laufe des Jahres mit WhisperX Technologie eine gute Alternative gibt.



hexeric
Beiträge: 293

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von hexeric »

für WHISPER hat jemand eine feine MAC APP programmiert, die es speziell in der pro version um einmalig 12€ in sich hat: https://goodsnooze.gumroad.com/l/macwhisper
eigentlich braucht man jetzt kaum noch was anderes, spuckt SRT aus, das liest heutzutage alles.



 Aktuelle Beiträge [alle Foren]
 
» ProResRAW Unterstützung in DaVinci Resolve 20.2
von Darth Schneider - Mi 8:50
» Nikon ZR - erstaunlich günstige DSLM mit integrierter RED-RAW Aufzeichnung
von MrMeeseeks - Mi 8:43
» YouTuber verliert Prozess - Bruce Willis Synchronstimme darf nicht geklont werden
von Jott - Mi 8:41
» Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?
von Darth Schneider - Mi 8:36
» Livestream: Apple stellt neue Produkte vor (Iphone 17 etc)
von 7River - Mi 7:18
» Canon Cinema EOS C50 - Vollformat kompakt mit 7K60p Open Gate RAW Aufzeichnung
von Darth Schneider - Mi 6:31
» Nikon Zr - Nikons erste eigene Cine-Kamera - am 10.Sept.
von pillepalle - Mi 2:14
» Was schaust Du gerade?
von roki100 - Mi 1:19
» iPhone 17 Pro: ProRes RAW, Genlock, Apple Log 2 und Blackmagic ProDock für Filmer
von iasi - Mi 1:02
» Apple Final Cut Camera 2.0 bringt iphone 17 Pro Apple Log 2, Genlock und Open Gate
von slashCAM - Mi 0:50
» Apples kostenlose Profi-Kamera App Final Cut Camera 1.1 mit neuen Funktionen
von vaio - Di 22:40
» Mein L-Mount Problem
von Jörg - Di 20:22
» RED V-RAPTOR XE
von pillepalle - Di 20:14
» Adobe Premiere Pro 25.5 enthält neu integrierte Effekte-Bibliothek
von TomStg - Di 19:45
» SIGMA erweitert ART-Serie um zwei lichtstarke Objektive
von roki100 - Di 18:41
» Canon EOS C400, C80, C70 und R5C bekommen neue Firmware
von slashCAM - Di 17:57
» Canon teasert neue, kompakte Kamera - Cine-Modell zur IBC?
von Darth Schneider - Di 17:35
» Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...
von Totao - Di 13:57
» Vegas Pro 23 ist da - mit Keyframe Editor und mehr GPU-Beschleunigung
von slashCAM - Di 13:14
» Nikon deaktiviert Authenticity Service für Z6 III
von Alex - Di 13:07
» D-Cinelike Material mit Avidemux kürzen in D-Cinelike möglich?
von Videopower - Di 11:24
» Google Pixel 10 Pro (XL) kommt mit Generativer KI direkt in der Kamera
von cantsin - Di 10:11
» Nikon Z5 II mit interner RAW-Aufzeichnung - Debayering, Rolling Shutter und Dynamik
von enii - Di 8:45
» !!BIETE!! GTX 1080 & GTX 970
von klusterdegenerierung - Mo 21:31
» !!BIETE!! 3x Godox SL-60W in Silent Version mit Noctua Lüfter!
von klusterdegenerierung - Mo 21:30
» Camcorder / Kamera für Konzertaufnahmen innen
von Bildlauf - Mo 19:41
» Nikon Z6 III - Sensor-Bildqualität, Rolling Shutter, Dynamik - Günstige Z8 für Filmer?
von roki100 - Mo 19:14
» Blackmagic Design Production Camera 4k in 2025?
von roki100 - Mo 18:58
» Sachtler aktiv16T/18T und FSB 16T/18T Mk II Fluidköpfe vorgestellt
von slashCAM - Mo 17:30
» Davinci Resolve ipad Musik einfügen
von vaio - Mo 16:47
» Philips Brilliance 27E3U7903: 5K-Monitor mit Thunderbolt 4 und Calman-Ready
von cantsin - Mo 16:01
» SMPTE-2110 für Blackmagic Converter, Audio Monitor, SmartView und Ethernet Switch
von slashCAM - Mo 13:24
» DJI Mini 5 Pro kostet so viel wie Mini 4 Pro
von patfish - Mo 0:46
» AJA IP25-R, UDC-4K und BRIDGE LIVE für Profi-Video-Workflows
von slashCAM - So 9:48
» BPCC6Kpro mit ipad 10 verbinden
von coldcase - So 1:27