Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum News-Kommentare-Forum

Infoseite // Googles KI schaut fern und lernt Lippen lesen



Newsmeldung von slashCAM:


Nach etlichen Stunden TV-Konsum soll die Google KI besser Lippen lesen können als menschliche Profis; mit einer Trefferquote um die 47% sollen die Algorithmen das Gesprochene korrekt erkennen. Diese Fähigkeit wird künftig wohl beispielweise bei der Spracherkennung miteinfließen (sofern visuelle Informationen vorhanden sind), auch im Security-Bereich bieten sich natürlich Einsatzmöglichkeiten, etwa um Aufnahmen von Überwachungskameras automatisch mit einer Dialogspur zu unterlegen. Außerdem -- etwas filmaffiner -- könne man so vielleicht sogar aus alten Stummfilmen wieder "Talkies" machen, indem das auf der Leinwand gesprochene erkannt, transkribiert und nachgesprochen wird. Was wir nicht unspannend fänden, allerdings weniger um die Filme "nachzubessern" (sie wurden schließlich ohne Dialog konzipiert), sondern aus reiner Neugier, was damals am Set gesprochen wurde. http://articles.latimes.com/1987-07-20/ ... ip-reading (Schätzungsweise nicht unbedingt das), was auf den Zwischentiteln stand... (Übrigens gibt es schon länger "unintelligente" Software, die Lippen "lesen" kann, diese muß dafür jedoch noch Laute in Lexika nachschlagen.)

Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Googles KI schaut fern und lernt Lippen lesen


Space


Antwort von Rudolf Max:

Wenn das am Schluss ebenso "gut" funktioniert wie die Google Sprachübersetzung, dann kanns ja heiter werden...

Die sollten nicht überall etwas neues und unwichtiges anfangen, eher mal etwas bestehendes und sinnvolles zur Perfektion, oder zumindest soweit bringen, dass es am Schluss auch Sinn macht...

So sehe ich das...

Rudolf

Space


Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum News-Kommentare-Forum

Antworten zu ähnlichen Fragen //


Generative KI: Googles StyleDrop lernt und imitiert Stil nach einem einzigen Bild
VCD aus USA oder Fern-Ost
KI synchronisiert Lippen und Audio in Echtzeit
Pika erstellt ab sofort Ki-Videoclips mit synchronen Lippen mittels Lip Sync
KI lernt kämpfen - und synthetisiert neue Martial Arts Moves
KI-basierte Grading-Lösung fylm.ai v1.3 lernt ein bißchen Kontext
Foto-Shooting plus KI: Schaut so die Zukunft der Fotografie aus?
Spaß mit NVIDIAs neuem Blickkontakt-Effekt: Robert De Niro schaut Dir in die Augen
Google's AI BARD schaut jetzt Videos
Gestensteuerung per Radar: Googles Project Soli - Die Zukunft des Bedieninterfaces?
MuZero: Googles DeepMind KI wird Videokompression für YouTube optimieren
Googles neuer Super-Resolution Algorithmus SR3 skaliert Gesichter nahezu perfekt hoch
Neue O3 Air Unit und Googles 2: DJI Technologie für FPV-Renndrohnen
Probleme beim slashCAM lesen über Vodafone?
Wie vom PC auf DVD-RAM so, daß Stand-Alone lesen kann?
DVDAuthorGUI kann MPEG nicht lesen - warum?
VirtualDub 1.5.10 - "VideoSourceAVI error" beim Lesen von DivX 5.11 Dateien !




slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash