slashCAM
Administrator
Administrator
Beiträge: 11279

WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von slashCAM »


Im September hatte OpenAI, die Entwickler unter anderem der Text-KI ChatGPT und der Bildgenerierungs-KI DALL-E 2, das Spracherkennungssystem Whisper vorgestellt, welches...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung



Frank Glencairn
Beiträge: 26509

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von Frank Glencairn »

Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Sapere aude - de omnibus dubitandum



holger_1
Beiträge: 88

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von holger_1 »

Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger



cantsin
Beiträge: 16314

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von cantsin »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Ja, aber eben nicht kostenlos, Open Source und auch offline nutzbar.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



j.t.jefferson
Beiträge: 1134

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von j.t.jefferson »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Manfred Baulig



freezer
Beiträge: 3573

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von freezer »

Frank Glencairn hat geschrieben: Mi 01 Feb, 2023 15:25 Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Frank, ich hab hier eine Anleitung der Schritte geschrieben, die bei mir funktioniert haben:
https://forum.blackmagicdesign.com/view ... 09#p906109
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



berlin123
Beiträge: 1249

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von berlin123 »

j.t.jefferson hat geschrieben: Mi 01 Feb, 2023 21:43
holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Fand das Feature in Premiere auch richtig gut. Die Texterkennung war erstaunlicherweise besser, als das was Google im Vergleich produzierte. Aber die Entwicklung in dem Bereich geht ja immer schneller voran.

Da kaum jemand in meinem Team Premiere hat, haben wir letztes Jahr https://www.descript.com verwendet. Anwenderfreundlich und erstellt qualitativ gute Subtitles, die wenig Nacharbeit brauchten.

Inzwischen wurde Descript aber zu einem Video-Editing Tool ausgebaut, was es für mich persönlich eher uninteressanter macht. Aver jetzt sieht ja so aus, dass es im Laufe des Jahres mit WhisperX Technologie eine gute Alternative gibt.



hexeric
Beiträge: 292

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von hexeric »

für WHISPER hat jemand eine feine MAC APP programmiert, die es speziell in der pro version um einmalig 12€ in sich hat: https://goodsnooze.gumroad.com/l/macwhisper
eigentlich braucht man jetzt kaum noch was anderes, spuckt SRT aus, das liest heutzutage alles.



 Aktuelle Beiträge [alle Foren]
 
» Gimbal Panasonic s5 ii
von Darth Schneider - Sa 5:23
» Werbung - es geht auch gut ;) Sammelthread
von Bluboy - Fr 17:59
» RØDE verschenkt neuen Wireless Micro Kameraempfänger als Upgrade
von slashCAM - Fr 12:27
» DJI Mini 5 Pro kommt in 5 Wochen - mit 50 Min Flugzeit und LiDAR
von blueplanet - Fr 12:10
» Seagates 30 TB HAMR-Festplatten ab sofort im Handel frei erhätlich
von slashCAM - Fr 9:30
» AV1 Codec in Premiere
von Bluboy - Do 19:19
» Sigma 17-40mm F1.8 DC ART an Sony FX30 und DJI RS4 Mini im Praxistest / Teil 1
von rush - Do 17:46
» Nanlite pico - neues, kompaktes Vollfarben-LED-Panel für die mobile Videoproduktion
von Alex - Do 17:02
» Neu in Adobe Firefly - Sound Effects, Kompositionsvorlagen und mehr
von slashCAM - Do 15:36
» ACHTUNG WETRANSFER!
von rush - Do 14:02
» DaVinci Resolve 20 Workshop - AI Depth Map unkompliziert für Titel-Effekte nutzen
von speedy gonzales - Do 13:58
» Portkeys LS7P - 7"-On-Camera-Monitor mit integrierter Kamerasteuerung
von tom - Do 11:29
» DJI Mavic 4 Pro in der Praxis: 10Bit 6K 50p Log, 360° Gimbal – für wen lohnt sich die C2 Drohne?
von wind1414 - Do 10:28
» Neue Lexar NM990 PCIe 5.0 SSD liest Daten mit bis zu 14.000 MB/s
von slashCAM - Do 10:24
» DJIs Mic 3 Funkmikro kommt bald zusammen mit der Osmo 360 Kamera
von tom - Do 10:10
» Panasonic LUMIX S1II im Praxistest: Beste Video-DSLM ihrer Klasse Dank 5.1K Open Gate u. hohem DR?
von radneuerfinder - Mi 23:20
» Licht how to:
von Darth Schneider - Mi 22:23
» Sony ECM-778 - neues XLR-Richtmikrofon mit Hi-Res Audio für Profis
von TomStg - Mi 19:39
» Biete: Tascam DR-10C Mini Rekorder
von pillepalle - Mi 18:17
» Biete: Fuji X-E1 Body - 16,3MP APS-C
von pillepalle - Mi 18:10
» Nikon Z f Vollformat DSLM im Retro-Look (FM2) für 2.499,- Euro vorgestellt: 24MP Sensor, 4K 10 Bit 60p …
von Funless - Mi 16:36
» Neue Nikon Z8 Firmware 3.01 soll Objektiv-Kompatibilität verbessern
von slashCAM - Mi 15:21
» Konkurrenz für IMAX - Neues HDR-Premiumkinoformat Vue Epic für Europa
von dienstag_01 - Mi 14:13
» Panasonic LUMIX S1II und S1IIE für Videofilmer - bis zu 15 Blendenstufen und ARRI Log
von roki100 - Mi 12:44
» Zwei leichte Samyang Prima-Objektive (16mm / 85mm) für Sony E vorgestellt
von slashCAM - Mi 10:12
» Vorsicht, Crew United Abo Falle!!
von hannaern - Mi 9:48
» RØDE Wireless Micro: Ab sofort auch kabellose iPhone-Aufnahme ohne Empfänger
von Blackbox - Di 17:46
» Motor Smart: Intelligenter AutoFocus-Motor von PDMovie nutzt LiDAR und KI
von Darth Schneider - Di 16:20
» Zoom M3 Mictrak Erfahrungen?
von Jörg - Di 15:46
» Social Media, KI & Co. - Neue Gefährdungslagen für die Meinungsvielfalt
von Blackbox - Di 15:46
» Zittern mit 50fps Clip in 25fps Timeline
von blueplanet - Di 13:14
» "32 Bit float" Recording - Ist das wirklich besser?
von ksingle - Di 12:37
» Neue Dummy-Adapter von SWIT für NP-F-, LP-E6- und NP-FZ100-Akkus
von Blackbox - Di 2:37
» LensNode Plug-In
von j.t.jefferson - Mo 22:36
» 15.000 Euro - welche Kamera
von pillepalle - Mo 21:04