slashCAM
Administrator
Administrator
Beiträge: 11279

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 4734

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1385

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 4734

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4426

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 4734

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» James Cameron will Schauspieler nicht durch Prompts ersetzen
von Rick SSon - Do 22:16
» ARRI soll (Teil)Verkauf erwägen
von iasi - Do 19:57
» Bye Bye Crucial - Micron stellt Speichergeschäft für Privatkunden ein
von Drushba - Do 19:26
» Antigravity A1 - die erste 360° Drohne ist da
von slashCAM - Do 18:57
» Nikon ZR Lesertest - kleine Kamera, riesiges Interesse
von cantsin - Do 17:56
» Was schaust Du gerade?
von pillepalle - Do 17:50
» Automatische Umschaltung auf Single‑ Viewer bei Widescreen- Monitor deaktivieren
von AndySeeon - Do 17:38
» Antigravity A1 - erste 360°-Kameradrohne ist offiziell
von Clemens Schiesko - Do 17:09
» Nikon ZR - Cinematische Anmutung durch halbiertes Debayering mit RED RAW NE
von Magnetic - Do 17:07
» Sony Alpha 7 V ist da: 33MP Partially Stacked Sensor, 4K 60p ohne Crop und 16 Stops
von Bildlauf - Do 16:48
» Sony und slashCam verlosen eine FX2 Cinema Line Kamera
von Magnetic - Do 14:19
» Sehr Leichte Doku Kamera?
von Funless - Do 13:11
» Zeitrafferaufnahme in Hannover?
von Pianist - Do 13:09
» Biete Sony FX2
von dnalor - Do 10:20
» ARD Produzentenbericht 2024
von ruessel - Do 9:02
» Ist Videojournalist/Videoproducer/Kameramann ein aussterbender Beruf?
von ruessel - Do 8:58
» Externe Stromversorgung für Nikon ZR
von Clemens Schiesko - Do 0:30
» Was hörst Du gerade?
von Nigma1313 - Do 0:27
» Suche DZOFilm Catta Zoom 18-35mm, Kauf oder Tausch
von FocusPIT - Mi 20:56
» Kling Video O1 - Multimodales Modell für generative und editierende Video-KI
von Phil999 - Mi 20:24
» Fell für DeadCat - evtl. Meterware gesucht
von Jörg - Mi 9:21
» Zlog2 und V-Log Vergleich
von Darth Schneider - Di 19:10
» PITCH DEIN DREHBUCH!
von Nigma1313 - Di 14:08
» Blackmagic DaVinci Resolve 20.3 bringt Support für 32K-Workflows und mehr
von Jott - Di 11:59
» Runway Gen-4.5 ist da - wieder auf Augenhöhe mit Veo und Sora?
von slashCAM - Di 10:45
» !!BIETE!! DJI AIR 3 Fly More Combo RC2
von klusterdegenerierung - Di 9:22
» Dedo Weigert gestorben
von pillepalle - Di 2:43
» Mini DV auf PC übertragen - verlustfrei
von blueplanet - Mo 21:26
» Audio zu dünn und leise – bitte um Unterstützung
von Chiara - Mo 20:48
» ZUNOW WCZ-280 4K Weitwinkelvorsatz
von kasar - Mo 17:22
» ByteDance Vidi2 produziert selbstständig fertige Videos aus Rohmaterial
von slashCAM - Mo 15:57
» Pilot-Film "The Last Dwarf" am K3 Film Festival (BMPCC4k)
von Erik01 - Mo 12:19
» F1 - offizieller Teaser Trailer
von rob - Mo 11:16
» 'was von DV Studio gehört?
von freezer - Mo 9:06
» Verkaufe 5 Canon EF Zooms - 16-35 2.8 L III, 24-70 L 2.8 II, 24-105 4.0 L II, 70-200 2.8 L II, 100-400 4.5-5.6 L
von v-empire - So 19:55