slashCAM
Administrator
Administrator
Beiträge: 11279

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 4575

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1363

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 4575

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4426

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 4575

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» Jetzt ist es offiziell - DJI Osmo 360 Kamera kommt am 31. Juli
von Clemens Schiesko - Do 14:17
» Verkaufe Walimex pro Flex LED 1000 Bi Color *SET*
von leonlhs - Do 9:00
» Verkaufe Sirui 24mm f2.8 Anamorphic Sony E-Mount APSC Objektiv (Ungenutzt / NEU)
von leonlhs - Do 8:55
» Formate für Medien
von Bluboy - Do 3:00
» Erste 360°-Drohne kommt - automatisiert, immersiv und 8K-fähig?
von Viteq - Mi 20:19
» Wann man ein Colorimeter beim Filmen braucht (und wann nicht): Datacolor LightColor Meter im Test
von beiti - Mi 17:25
» SynthEyes 2025.5 Release nutzt Machine-Learning für automatisches Motion-Tracking
von slashCAM - Mi 15:54
» Konkurrenz für Apples Pro Display XDR - Asus ProArt Display 6K PA32QCV erscheint nächsten Monat
von slashCAM - Mi 11:51
» Avatar: Fire and Ash
von GaToR-BN - Mi 11:27
» Neue Firmware für Canon EOS C80, C400, R1, R5, R5 II und R5 C verfügbar
von roki100 - Mi 0:49
» Zacuto Z-Finder für die Sony Z300 angekündigt
von roki100 - Mi 0:40
» Kameras mit "Extended Video" wie bei Blackmagic
von Marc01 - Mo 23:09
» Video-optimierte Petzval-Objektive mit fokusgekoppelter Bokeh-Kontrolle
von Jalue - Mo 20:40
» Werkhallen mit LED beleuchten – Erfahrungen gesucht
von freezer - Mo 16:53
» Fuji X-E4 OVP
von thsbln - Mo 13:58
» Nikon Z5 II im slashCam-Check: Fullframe-Hybrid für Einsteiger-Filmer
von toniwan - Mo 12:30
» WhoFi - Neue KI kann Personen nur per WLAN-Signal identifizieren
von rudi - Mo 11:34
» Film wurde nur mit Handys gedreht...
von scrooge - Mo 7:41
» Biete: smallHD Focus 5 Kamera-Monitor
von pillepalle - Mo 2:05
» Biete: Tentacle Sync O.G. Timecode Generatoren
von pillepalle - So 21:40
» Biete: Sigma Art f1.4 24mm DG HSM Nikon F-Mount
von pillepalle - So 11:47
» Biete: Sigma Art f1.4 50mm DG HSM Nikon F-Mount
von pillepalle - So 11:46
» Kioxia stellt neuen Rekord auf: NVMe-SSD mit 245 TB
von slashCAM - So 10:33
» Sony PXW-Z300 3-Chip-Camcorder vorgestellt mit V-Mount, KI, C2PA
von gunman - So 8:27
» Sony RX1R III mit Vollformat und 35mm Fixoptik vorgestellt, filmt in 4K
von Darth Schneider - Sa 20:49
» Licht how to:
von Darth Schneider - Sa 18:56
» Runway Act-Two verfügbar für bessere Figurenanimation
von iasi - Sa 18:14
» Neues Blackmagic Design Media Module 16 TB für URSA Cine Kameras
von Darth Schneider - Fr 16:33
» Nikon patentiert HDMI RAW RGGB Ausgabe - eingebettet in YUV-Streams
von CameraRick - Fr 12:06
» Stone, Antonioni, Greenaway und Zapruder
von Darth Schneider - Do 22:34
» GoPro MAX 2 gesichtet und DJI Osmo 360 komplett geleakt
von Clemens Schiesko - Do 19:45
» Alien: Romulus - Teaser Trailer online - produziert von Ridley Scott, gedreht auf Alexa 35
von Darth Schneider - Do 18:17
» Bekommt DJI bald neue Drohnen-Konkurrenz?
von medienonkel - Do 18:00
» Resolve rückstandslos vom Rechner entfernen.
von Jörg - Do 14:39
» Musikvideo „Trust“ Insta 360
von Magnetic - Do 13:36