slashCAM
Administrator
Administrator
Beiträge: 11279

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 4651

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1371

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 4651

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4426

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 4651

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» Google Veo 3 und Veo 3 Fast: Neue Features, 1080p-Support und drastische Preissenkung
von slashCAM - Di 16:24
» Blackmagic unterstützt Apple ProRes RAW - nicht nur in Resolve
von Darth Schneider - Di 12:07
» Nanlux Evoke 150C + 600C Spotlight erklärt: Größtes Farbspektrum ihrer Klasse?
von slashCAM - Di 8:27
» Verschiedene Kameramodelle & Aufnahmeformate für Familienfeier vereinen
von Jott - Di 5:55
» Fujifilm GMX Eterna 55 erklärt: Aufnahmeformate, Großformat-Open-Gate, Fujinon 32-90
von Darth Schneider - Mo 19:41
» Was kommt, wenn die Gletscher verschwinden?
von Jott - Mo 19:12
» SmallRig Tribex Monopod, iPhone 17 Cages + High Capacity 221 Wh Akku erklärt
von slashCAM - Mo 9:51
» Magic Lantern mit deutlichem Lebenszeichen - Frische Motivation und frischer Code
von Walter Schulz - Mo 8:42
» RØDE senkt Preise für seine RØDE Wireless Mikrofonsysteme radikal
von Darth Schneider - Mo 8:14
» Panasonic LUMIX S1II im Praxistest: Beste Video-DSLM ihrer Klasse Dank 5.1K Open Gate u. hohem DR?
von Darth Schneider - So 22:43
» BRAW für Sony Kameras Sony FX3/FX3A, FX30, FX6 & FX9
von rush - So 21:33
» Erfahrungen mit vibrationsgedämpften Kamerabefestigungen an Motorrädern
von iasi - So 21:27
» ARRI soll (Teil)Verkauf erwägen
von iasi - So 19:41
» Ambient Lockit BT
von pillepalle - So 18:42
» Biete Sony Set FS7 Komplettset mit 28135G XDCA etc
von michael_zimmer - So 18:25
» Canon Legria HF G40 Camcorder mit Wide DR // CES 2016
von Jan - So 17:46
» Vimeo wird vom Investor Bending Spoons übernommen
von cantsin - So 17:13
» Fujifilm GFX Eterna 55 demnächst verfügbar für 16.500 Dollar
von Jott - So 16:05
» Edius 11.40 auf der IBC vorgestellt
von Bruno Peter - So 10:28
» Sachtler aktiv16T/18T und FSB 16T/18T Mk II Fluidköpfe vorgestellt
von pillepalle - So 1:45
» Neue Vocas Matte Box MB-260 - kompakt und frei konfigurierbar
von slashCAM - Sa 18:45
» ATOMOSphere erhält mobile Oberfläche und Transkriptionsfunktion
von slashCAM - Sa 12:51
» Blackmagic Camera App 3.0 für Android und iOS bringt viele Neuerungen
von Axel - Sa 11:32
» Alien: Romulus - Teaser Trailer online - produziert von Ridley Scott, gedreht auf Alexa 35
von 7River - Sa 7:22
» BPCC6Kpro mit ipad 10 verbinden
von coldcase - Fr 23:51
» Blackmagic Camera ProDock für iPhone 17 erklärt
von slashCAM - Fr 21:21
» Atomos stellt Studio PRO-2710 4K OLED Referenzmonitor mit Umgebungslicht-Kalibrierung vor
von slashCAM - Fr 18:40
» Atomos Shinobi 7 RX - 7" HDR-SDI/HDMI-Monitor mit Kamerasteuerung und Touch-Fokus
von pillepalle - Fr 17:48
» Sigma 20-200mm F3.5-6.3 DG | Contemporary vorgestellt
von slashCAM - Fr 15:59
» Blackmagic Camera ProDock - Dockingstation für iPhone 17 Pro Filmer
von rush - Fr 9:01
» Datacolor SpyderExpress - Monitor-Farbkalibrierung in nur 90 Sekunden
von slashCAM - Do 9:33
» Nikon ZR - erstaunlich günstige DSLM mit integrierter RED-RAW Aufzeichnung
von pillepalle - Mi 22:43
» RED V-RAPTOR XE - 8K Global Shutter Vista Vision Kamera zum halben Preis
von iasi - Mi 18:12
» Cartoni Mixo 21 Fluid Head
von pillepalle - Mi 17:05
» Canon Cinema EOS C50 - Vollformat kompakt mit 7K60p Open Gate RAW Aufzeichnung
von Rick SSon - Mi 12:25