slashCAM
Administrator
Administrator
Beiträge: 11279

WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von slashCAM »


Im September hatte OpenAI, die Entwickler unter anderem der Text-KI ChatGPT und der Bildgenerierungs-KI DALL-E 2, das Spracherkennungssystem Whisper vorgestellt, welches...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung



Frank Glencairn
Beiträge: 26509

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von Frank Glencairn »

Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Sapere aude - de omnibus dubitandum



holger_1
Beiträge: 88

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von holger_1 »

Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger



cantsin
Beiträge: 16678

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von cantsin »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Ja, aber eben nicht kostenlos, Open Source und auch offline nutzbar.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



j.t.jefferson
Beiträge: 1158

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von j.t.jefferson »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Manfred Baulig



freezer
Beiträge: 3619

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von freezer »

Frank Glencairn hat geschrieben: Mi 01 Feb, 2023 15:25 Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Frank, ich hab hier eine Anleitung der Schritte geschrieben, die bei mir funktioniert haben:
https://forum.blackmagicdesign.com/view ... 09#p906109
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



berlin123
Beiträge: 1315

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von berlin123 »

j.t.jefferson hat geschrieben: Mi 01 Feb, 2023 21:43
holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Fand das Feature in Premiere auch richtig gut. Die Texterkennung war erstaunlicherweise besser, als das was Google im Vergleich produzierte. Aber die Entwicklung in dem Bereich geht ja immer schneller voran.

Da kaum jemand in meinem Team Premiere hat, haben wir letztes Jahr https://www.descript.com verwendet. Anwenderfreundlich und erstellt qualitativ gute Subtitles, die wenig Nacharbeit brauchten.

Inzwischen wurde Descript aber zu einem Video-Editing Tool ausgebaut, was es für mich persönlich eher uninteressanter macht. Aver jetzt sieht ja so aus, dass es im Laufe des Jahres mit WhisperX Technologie eine gute Alternative gibt.



hexeric
Beiträge: 293

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von hexeric »

für WHISPER hat jemand eine feine MAC APP programmiert, die es speziell in der pro version um einmalig 12€ in sich hat: https://goodsnooze.gumroad.com/l/macwhisper
eigentlich braucht man jetzt kaum noch was anderes, spuckt SRT aus, das liest heutzutage alles.



 Aktuelle Beiträge [alle Foren]
 
» Panasonic kündigt Supertele-Zoom LUMIX S 100-500mm F5-7.1 an
von slashCAM - Fr 10:30
» Avatar: Fire and Ash
von 7River - Do 22:57
» Licht how to:
von Darth Schneider - Do 19:47
» EIZO ColorEdge Flaggschiff Monitor CG3100X und CG2400SV erklärt
von slashCAM - Do 14:48
» Neues OWC Thunderbolt-5-Dock erreicht bis zu 2.500 MB/s übers Netzwerk
von slashCAM - Do 10:24
» diashow - wie lange jedes bild?
von wabu - Do 9:59
» Endlich mal wieder originelle Ansätze im Kino
von cantsin - Do 0:19
» Blackmagic DaVinci Resolve 20.2.1 bringt Verbesserung fürs Editing und mehr
von Jott - Mi 19:50
» LETsDOK Dokumentarfilmtage 2025 bringt über 70 Dokus in Kinos und TV
von slashCAM - Mi 16:30
» Stabileye
von Phil999 - Di 14:30
» Neuer Atomos Ninja TX, Shinobi 7RX + neuer Reference Monitor erklärt
von MarcusG - Di 14:20
» Atomos Sun Dragon - 5-Farben-HDR-LED-Lichtstreifen mit CRI99 Lichtgüte
von Asjaman - Di 8:59
» !!BIETE!! ZEAPON MICRO 2 Slider 54cm bis 5KG
von klusterdegenerierung - Mo 23:40
» !!BIETE!! ZEAPON Easylock 2 Tisch Stativ für MICRO 2 Slider
von klusterdegenerierung - Mo 20:23
» !!BIETE!! ZEAPON Motor für MICRO 2 Slider
von klusterdegenerierung - Mo 20:22
» !!BIETE!! TILTA Nucleus Nano I
von klusterdegenerierung - Mo 17:10
» ALEXA 35 Update: ARRICORE für Xtreme & neue Features für alle Modelle
von slashCAM - Mo 15:18
» Was hörst Du gerade?
von Funless - Mo 14:46
» DaVinci Cache auf welche SSD?
von dienstag_01 - Mo 12:57
» DJI MIC 2 - XLR Adapter
von rush - Mo 12:17
» Was tun, wenn das Wasser fehlt? Klimawandelfolgen-Doku Teil 2
von Darth Schneider - Mo 6:37
» Caspar David Friedrich - Filter
von Axel - So 13:39
» Wiegt die DJI Mini 5 Pro wirklich unter 250 Gramm?
von Jost - So 10:46
» Aputure NOVA II 2x1 - 1.000W LED-Panel mit BLAIR-CG-Engine
von Jominator - So 10:31
» Neue Funktionen für Frame.io verbessern Sicherheit und Sharing
von slashCAM - So 9:33
» Apple Final Cut Camera 2.0 bringt iphone 17 Pro Apple Log 2, Genlock und Open Gate
von vaio - Sa 12:40
» Nikon NRAW als RED RAW prozessieren
von cantsin - Sa 11:48
» Canon Cinema EOS C50 Sensor-Bildqualität - Debayering, Rolling Shutter und Dynamik
von Walter Schulz - Sa 9:40
» Leitz Hektor - sechs Cine-Objektive für DSLM & Co vorgestellt
von philr - Sa 9:25
» DR Lüftergeräusche + Windgeräusche rausfiltern
von Jott - Sa 8:25
» Überraschung: Kyno 1.9 ist erschienen mit Apple Silicon Support und neuem Design
von slashCAM - Fr 15:24
» Hardware für Creators - Die besten 4K/8K Schnittrechner - Frühling 2025
von Mayk - Fr 13:23
» Resolve Color Grading Tutorials
von freezer - Fr 11:18
» Nvidia + Intel arbeiten an gemeinsamen SoC
von markusG - Fr 10:09
» Video mit KI bearbeiten
von Bluboy - Do 23:33