slashCAM
Administrator
Administrator
Beiträge: 11262

WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von slashCAM »


Im September hatte OpenAI, die Entwickler unter anderem der Text-KI ChatGPT und der Bildgenerierungs-KI DALL-E 2, das Spracherkennungssystem Whisper vorgestellt, welches...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung



Frank Glencairn
Beiträge: 23185

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von Frank Glencairn »

Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Sapere aude - de omnibus dubitandum



holger_1
Beiträge: 85

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von holger_1 »

Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger



cantsin
Beiträge: 14312

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von cantsin »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Ja, aber eben nicht kostenlos, Open Source und auch offline nutzbar.



j.t.jefferson
Beiträge: 994

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von j.t.jefferson »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.



freezer
Beiträge: 3297

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von freezer »

Frank Glencairn hat geschrieben: Mi 01 Feb, 2023 15:25 Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Frank, ich hab hier eine Anleitung der Schritte geschrieben, die bei mir funktioniert haben:
https://forum.blackmagicdesign.com/view ... 09#p906109
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



berlin123
Beiträge: 732

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von berlin123 »

j.t.jefferson hat geschrieben: Mi 01 Feb, 2023 21:43
holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Fand das Feature in Premiere auch richtig gut. Die Texterkennung war erstaunlicherweise besser, als das was Google im Vergleich produzierte. Aber die Entwicklung in dem Bereich geht ja immer schneller voran.

Da kaum jemand in meinem Team Premiere hat, haben wir letztes Jahr https://www.descript.com verwendet. Anwenderfreundlich und erstellt qualitativ gute Subtitles, die wenig Nacharbeit brauchten.

Inzwischen wurde Descript aber zu einem Video-Editing Tool ausgebaut, was es für mich persönlich eher uninteressanter macht. Aver jetzt sieht ja so aus, dass es im Laufe des Jahres mit WhisperX Technologie eine gute Alternative gibt.



hexeric
Beiträge: 266

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von hexeric »

für WHISPER hat jemand eine feine MAC APP programmiert, die es speziell in der pro version um einmalig 12€ in sich hat: https://goodsnooze.gumroad.com/l/macwhisper
eigentlich braucht man jetzt kaum noch was anderes, spuckt SRT aus, das liest heutzutage alles.



 Aktuelle Beiträge [alle Foren]
 
» Atomos Neon 24 - 4K HDR-Grading Display-Recorder
von teichomad - Mi 9:14
» Atomos Ninja als HDMI-Recorder
von Saint.Manuel - Mi 8:41
» DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt
von freezer - Mi 8:20
» Meine erste Kritik in Filmthread :-)
von Frank Glencairn - Mi 8:12
» Kostenloser Fairlight Workshop mit Mary Plummer
von Frank Glencairn - Mi 6:31
» Musikvideo Floridas Klaus "Che Guevara"
von MK - Di 18:37
» Realistischer und mehr Details - Adobe Firefly Image 3 Model für Web und Photoshop
von slashCAM - Di 14:48
» Adobe Firefly KI jetzt auch mobil in neuer Express App verfügbar
von slashCAM - Di 14:15
» Z Cam E2G, E2C, E2-6F, E2-S6, E2-F8
von Clemens Schiesko - Di 13:45
» Canon öffnet RF-Mount - aber nur für APS-C
von stip - Di 10:10
» Cannes 2024
von 7River - Di 9:28
» Woody Allen: Coup de Chance (ab Herbst 2023, Venedig)
von Skeptiker - Di 8:19
» Panasonic HC X2000 und Rode
von rush - Mo 21:02
» SmallRig: Creators Toolkit
von Darth Schneider - Mo 15:13
» Bullet Time Setup aus 75 DSLRs :)
von LarsS - Mo 12:49
» Dehancer Pro - Filmsimulation auf höchstem Niveau
von MK - Mo 12:12
» Kostenlose Motion Cam App ermöglicht erstmals CinemaDNG RAW-Videoaufnahme auf Smartphones
von cantsin - Mo 9:39
» Air2S Problem Speicherkarte
von Jott - Mo 9:34
» CyberLink PowerDirector: Noch mehr integrierte KI-Effekte für Video
von medienonkel - So 18:40
» Anfänger im Schnitt Stunden- bzw. Tageshonorar Beteiligung am Gewinn
von Bergspetzl - So 18:17
» AOCs neue Preisbrecher-Monitore für Bildverarbeitung
von cantsin - So 17:51
» Tilta Khronos Zubehör-System fürs iPhone 15 Pro
von iasi - So 16:17
» Ärger mit Micro Sandisk extr Pro
von macaw - So 0:15
» AJA kündigt zahlreiche Produkt-Updates mit neuen Funktionen an
von medienonkel - Sa 19:26
» Werbung - es geht auch gut ;) Sammelthread
von Alex - Sa 12:37
» Sony bringt weiteres Weitwinkel-Zoomobjektiv - FE 16-25mm F2.8 G
von TomStg - Sa 9:27
» Samyang V-AF - Autofokus-Objektive für (Sony Alpha-)Filmer
von radneuerfinder - Fr 23:35
» Dank KI: Propagandafilm leichtgemacht
von macaw - Fr 21:12
» Netflix „Ripley“
von Frank Glencairn - Fr 19:17
» Blackmagic URSA Cine 12K - 16 Blendenstufen für 15.000 Dollar!
von Frank Glencairn - Fr 17:33
» Fujinon XF 18-120mmF4 LM OZ WR - Erfahrungsbericht
von Skeptiker - Fr 15:44
» BADEN GEHEN | Making Of + Teaser
von Clemens Schiesko - Fr 15:38
» Angelbird MagSafe externe Recording Modules - nicht nur für iPhones
von soulbrother - Fr 11:47
» Blackmagic URSA Cine 12K erklärt: Dynamikumfang, Monitoring-Setup uvm...
von slashCAM - Fr 11:39
» Western Digital stellt weltweit erste 4 TB SD-Karte vor
von dienstag_01 - Fr 10:00