slashCAM
Administrator
Administrator
Beiträge: 11279

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 4649

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1369

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 4649

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4426

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 4649

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» AI-Diskussionsthread - Pro/Kontra?
von cantsin - Do 19:12
» Twixtor Probleme mit Marking Points
von Jott - Do 19:03
» Welches Update für Ursa MiniPro 12K?
von Jost - Do 17:47
» Neue Luma AI Ray3 Video-KI erstellt erstmals Clips mit nativem HDR
von slashCAM - Do 15:04
» LaCie Rugged SSD4: Schneller und robuster Speicher für unterwegs vorgestellt
von slashCAM - Do 14:33
» SmallRig X-Touch X221: V-Mount Akku mit IP54, Touchscreen und App-Kontrolle
von slashCAM - Do 11:30
» DJI Mini 5 Pro bringt grossen 1" Sensor, LiDAR und 4K mit 120fps
von Jott - Do 6:04
» Kinefinity Eagle-EVF erhält u.a. Log-to-Rec.709 Vorschau
von UWCine - Mi 21:31
» Viltrox wird Mitglied der L-Mount Alliance
von cantsin - Mi 20:00
» Die Canon EOS C50 erklärt - 7K RAW, 120p 4K und Open Gate
von pillepalle - Mi 16:08
» Revolutionärer AF für Cine-Objektive: Tilta Autofokus-Adapter zapft interne Kamera-AF-Daten an
von pillepalle - Mi 15:32
» Das gesamte aktuelle Z-Cam Lineup ausführlich erklärt
von Rick SSon - Mi 13:53
» Sigma Cine-Zoom 28-45mm T2 FF demnächst für 2.999 Euro erhältlich
von rudi - Mi 13:23
» Weniger Mikros sind mehr
von acrossthewire - Mi 9:52
» Linsen (Vintage, Anamorphic & Co.)
von roki100 - Mi 0:42
» Blackmagic DaVinci Resolve 20.2 bringt neben Apple ProRes RAW u.a. benutzerdefinierte Metadaten
von freezer - Di 17:31
» Asus ProArt P16 mit AMD Ryzen AI 9 HX 370 CPU und RTX 5090 vorgestellt
von tom - Di 16:35
» Google Veo 3 und Veo 3 Fast: Neue Features, 1080p-Support und drastische Preissenkung
von slashCAM - Di 16:24
» Blackmagic unterstützt Apple ProRes RAW - nicht nur in Resolve
von Darth Schneider - Di 12:07
» Nanlux Evoke 150C + 600C Spotlight erklärt: Größtes Farbspektrum ihrer Klasse?
von slashCAM - Di 8:27
» Verschiedene Kameramodelle & Aufnahmeformate für Familienfeier vereinen
von Jott - Di 5:55
» Fujifilm GMX Eterna 55 erklärt: Aufnahmeformate, Großformat-Open-Gate, Fujinon 32-90
von Darth Schneider - Mo 19:41
» Was kommt, wenn die Gletscher verschwinden?
von Jott - Mo 19:12
» SmallRig Tribex Monopod, iPhone 17 Cages + High Capacity 221 Wh Akku erklärt
von slashCAM - Mo 9:51
» Magic Lantern mit deutlichem Lebenszeichen - Frische Motivation und frischer Code
von Walter Schulz - Mo 8:42
» RØDE senkt Preise für seine RØDE Wireless Mikrofonsysteme radikal
von Darth Schneider - Mo 8:14
» Panasonic LUMIX S1II im Praxistest: Beste Video-DSLM ihrer Klasse Dank 5.1K Open Gate u. hohem DR?
von Darth Schneider - So 22:43
» BRAW für Sony Kameras Sony FX3/FX3A, FX30, FX6 & FX9
von rush - So 21:33
» Erfahrungen mit vibrationsgedämpften Kamerabefestigungen an Motorrädern
von iasi - So 21:27
» ARRI soll (Teil)Verkauf erwägen
von iasi - So 19:41
» Ambient Lockit BT
von pillepalle - So 18:42
» Biete Sony Set FS7 Komplettset mit 28135G XDCA etc
von michael_zimmer - So 18:25
» Canon Legria HF G40 Camcorder mit Wide DR // CES 2016
von Jan - So 17:46
» Vimeo wird vom Investor Bending Spoons übernommen
von cantsin - So 17:13
» Fujifilm GFX Eterna 55 demnächst verfügbar für 16.500 Dollar
von Jott - So 16:05