slashCAM
Administrator
Administrator
Beiträge: 11279

WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von slashCAM »


Im September hatte OpenAI, die Entwickler unter anderem der Text-KI ChatGPT und der Bildgenerierungs-KI DALL-E 2, das Spracherkennungssystem Whisper vorgestellt, welches...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung



Frank Glencairn
Beiträge: 26509

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von Frank Glencairn »

Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Sapere aude - de omnibus dubitandum



holger_1
Beiträge: 88

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von holger_1 »

Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger



cantsin
Beiträge: 17138

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von cantsin »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Ja, aber eben nicht kostenlos, Open Source und auch offline nutzbar.
"Wieso eigentlich überhaupt was drehen? Warum nicht jahrelang nur darüber philosophieren?" -stip



j.t.jefferson
Beiträge: 1191

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von j.t.jefferson »

holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Manfred Baulig



freezer
Beiträge: 3719

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von freezer »

Frank Glencairn hat geschrieben: Mi 01 Feb, 2023 15:25 Da gabs ja schon mal ne Version die mit Resolve funktioniert, ich hab's allerdings leider nicht zum laufen bekommen.
Wäre super wenn da mal einer einen vernünftigen Installer schreiben würde.
Frank, ich hab hier eine Anleitung der Schritte geschrieben, die bei mir funktioniert haben:
https://forum.blackmagicdesign.com/view ... 09#p906109
LAUFBILDkommission
Robert Niessner - Graz - Austria
Blackmagic Cinema Blog
www.laufbildkommission.wordpress.com



berlin123
Beiträge: 1388

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von berlin123 »

j.t.jefferson hat geschrieben: Mi 01 Feb, 2023 21:43
holger_1 hat geschrieben: Mi 01 Feb, 2023 19:51 Gibt es da nicht auch schon mehrere Online-Tools für die Transkription? So etwa simonsaysai.com ect...
Und in Premiere ist auch vergleichbares schon eingebaut?

VG

Holger
Jau...in Premiere auch mit Sprechererkennung und man kann im Transkript sogar "schneiden". Heisst wenn du da ne Passage löschst, wirds auch weggeschnitten. Anglezismen muss man dann dem Programm beibringen und werden dann aber bei mehrmaligen vorkommen automatisch korrigiert. Finde das Ding ultra geil. Ahja Untertitel werden dann auch automatisch gemacht.

Würde gern mal nen Vergleich zu dem Tool hier und zu dem in Premiere sehen.
Fand das Feature in Premiere auch richtig gut. Die Texterkennung war erstaunlicherweise besser, als das was Google im Vergleich produzierte. Aber die Entwicklung in dem Bereich geht ja immer schneller voran.

Da kaum jemand in meinem Team Premiere hat, haben wir letztes Jahr https://www.descript.com verwendet. Anwenderfreundlich und erstellt qualitativ gute Subtitles, die wenig Nacharbeit brauchten.

Inzwischen wurde Descript aber zu einem Video-Editing Tool ausgebaut, was es für mich persönlich eher uninteressanter macht. Aver jetzt sieht ja so aus, dass es im Laufe des Jahres mit WhisperX Technologie eine gute Alternative gibt.



hexeric
Beiträge: 295

Re: WhisperX: Kostenlose lautgenaue Audiotranskription mit Sprechererkennung

Beitrag von hexeric »

für WHISPER hat jemand eine feine MAC APP programmiert, die es speziell in der pro version um einmalig 12€ in sich hat: https://goodsnooze.gumroad.com/l/macwhisper
eigentlich braucht man jetzt kaum noch was anderes, spuckt SRT aus, das liest heutzutage alles.



 Aktuelle Beiträge [alle Foren]
 
» Verstehen Video-KIs die Welt? Physik-IQ enthüllt Grenzen der Modelle
von Bildlauf - Mo 17:29
» Bye Bye Crucial - Micron stellt Speichergeschäft für Privatkunden ein
von Darth Schneider - Mo 15:21
» Atomos Ninja TX GO/Ninja TX bekommen Support für mehr Formate und Kameras
von Darth Schneider - Mo 8:35
» Von Mickey Mouse bis Darth Vader - Disney lizenziert seine Figuren an OpenAIs Sora
von slashCAM - So 21:36
» DJI Osmo Action 4 Actionkamera - Wo Bildschärfe und Rauschunterdrückung einstellen?
von King Rollo - So 11:38
» Mocha Pro 2026 mit komplett überarbeitetem Kurveneditor u.a. verfügbar
von slashCAM - So 10:30
» Ist Sam Altman schuld an der großen Speicherkrise?
von Phil999 - Sa 17:44
» Videocontent für LED-Bande
von Kino - Fr 23:40
» !!BIETE!! iPhone SE 1. Gen 32GB Spießergepflegt
von klusterdegenerierung - Fr 20:44
» !!BIETE!! 4x Manfrotto AutoPole bi 3,7m
von klusterdegenerierung - Fr 20:43
» !!BIETE!! 4x COLORAMA Foto Hintergrund 2,7m
von klusterdegenerierung - Fr 20:43
» Nikon ZR - Cinematische Anmutung durch halbiertes Debayering mit RED RAW NE
von j.t.jefferson - Fr 20:09
» Canon R7: 4K oder 1080p?
von Darth Schneider - Fr 16:27
» Coca-Cola gibt KI als Kreativität aus und lässt Weihnachts-Werbespot generieren
von Darth Schneider - Fr 16:22
» BM Cinema Camera 6K - Autofokus Beta Firmware
von acrossthewire - Fr 12:35
» Verkaufe Canon EF 24-70mm f2.8 L II USM
von v-empire - Do 22:29
» Nahtloser 1-9x Zoom dank neuartiger optischer Konstruktion?
von medienonkel - Do 16:10
» CineBias by RED - 9 neue, kostenlose Nikon Bildrezepte
von Funless - Do 15:39
» Preis für eigene Ausrüstung
von tehaix - Do 13:46
» NANLUX und DoPchoice Snapbag Octa 5& Shallow Soft mit NL Mount vorgestellt
von slashCAM - Do 10:15
» RIP Jeff Wexler
von pillepalle - Do 7:59
» Was hörst Du gerade?
von Funless - Do 0:04
» Zoom LiveTrak L12next - Mixer, Multitrack-Recorder und Audiointerface
von rush - Mi 20:59
» Sony Alpha 1 bekommt präzisere Fokussteuerung und mehr Kontrolle für Gimbal-Setups
von slashCAM - Mi 13:12
» Blackmagic Camera App 3.0 für Android und iOS bringt viele Neuerungen
von Heiko1974 - Mi 11:59
» Kameras, Objektive, Drohnen: Bis zu 1.530 Euro sparen bei Sony, Nikon & Co.
von slashCAM - Mi 11:54
» Tilta stellt neue, ausziehbare Schulterpolster-Baseplate vor
von marty_mc - Mi 9:44
» Eckpunkte einer neuen Filmförderung: mehr Kreativität, weniger Bürokratie?
von Alex - Mi 8:31
» Was macht einen Film erfolgreich?
von 7River - Mi 7:20
» Schnittrechner
von n8shift - Mi 1:28
» !!BIETE!! HiFi Lautsprecher von Cambridge Audio Neu
von klusterdegenerierung - Di 20:02
» Nikon ZR Lesertest - kleine Kamera, riesiges Interesse
von j.t.jefferson - Di 19:31
» Sanken COS-11D mit Rekorder
von berlin123 - Di 17:04
» Die deutsche Filmförderung ist ein MILLIARDENGRAB - Uwes Woche
von iasi - Di 13:23
» Wenn man den Kotzschlauch sieht - Peinliche Fehler in neuer 4K Version von Mad Men
von slashCAM - Di 11:06