slashCAM
Administrator
Administrator
Beiträge: 11279

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 4740

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1385

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 4740

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4426

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 4740

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» Atomos Ninja TX GO/Ninja TX bekommen Support für mehr Formate und Kameras
von Jott - So 23:28
» Von Mickey Mouse bis Darth Vader - Disney lizenziert seine Figuren an OpenAIs Sora
von slashCAM - So 21:36
» Was schaust Du gerade?
von Darth Schneider - So 20:16
» Verstehen Video-KIs die Welt? Physik-IQ enthüllt Grenzen der Modelle
von MaxSchreck - So 20:08
» Nikon ZR in der Praxis: 6K 50p RED RAW Monster für 2.349,- Euro mit klassenbester Colorscience?
von cantsin - So 17:35
» DJI Osmo Action 4 Actionkamera - Wo Bildschärfe und Rauschunterdrückung einstellen?
von King Rollo - So 11:38
» Mocha Pro 2026 mit komplett überarbeitetem Kurveneditor u.a. verfügbar
von slashCAM - So 10:30
» Sony FX3 Sensor-Test - Dynamik, Debayering und Rolling Shutter
von iasi - So 9:06
» Ist Sam Altman schuld an der großen Speicherkrise?
von Phil999 - Sa 17:44
» Was hast Du zuletzt gekauft?
von StanleyK2 - Sa 17:18
» Netflix will die Filmsparte von Warner Bros. Discovery übernehmen
von Darth Schneider - Sa 14:47
» Videocontent für LED-Bande
von Kino - Fr 23:40
» !!BIETE!! iPhone SE 1. Gen 32GB Spießergepflegt
von klusterdegenerierung - Fr 20:44
» !!BIETE!! 4x Manfrotto AutoPole bi 3,7m
von klusterdegenerierung - Fr 20:43
» !!BIETE!! 4x COLORAMA Foto Hintergrund 2,7m
von klusterdegenerierung - Fr 20:43
» Nikon ZR - Cinematische Anmutung durch halbiertes Debayering mit RED RAW NE
von j.t.jefferson - Fr 20:09
» Canon R7: 4K oder 1080p?
von Darth Schneider - Fr 16:27
» Coca-Cola gibt KI als Kreativität aus und lässt Weihnachts-Werbespot generieren
von Darth Schneider - Fr 16:22
» BM Cinema Camera 6K - Autofokus Beta Firmware
von acrossthewire - Fr 12:35
» Verkaufe Canon EF 24-70mm f2.8 L II USM
von v-empire - Do 22:29
» Nahtloser 1-9x Zoom dank neuartiger optischer Konstruktion?
von medienonkel - Do 16:10
» CineBias by RED - 9 neue, kostenlose Nikon Bildrezepte
von Funless - Do 15:39
» Preis für eigene Ausrüstung
von tehaix - Do 13:46
» NANLUX und DoPchoice Snapbag Octa 5& Shallow Soft mit NL Mount vorgestellt
von slashCAM - Do 10:15
» RIP Jeff Wexler
von pillepalle - Do 7:59
» Was hörst Du gerade?
von Funless - Do 0:04
» Zoom LiveTrak L12next - Mixer, Multitrack-Recorder und Audiointerface
von rush - Mi 20:59
» ARRI soll (Teil)Verkauf erwägen
von Pianist - Mi 13:21
» Sony Alpha 1 bekommt präzisere Fokussteuerung und mehr Kontrolle für Gimbal-Setups
von slashCAM - Mi 13:12
» Blackmagic Camera App 3.0 für Android und iOS bringt viele Neuerungen
von Heiko1974 - Mi 11:59
» Kameras, Objektive, Drohnen: Bis zu 1.530 Euro sparen bei Sony, Nikon & Co.
von slashCAM - Mi 11:54
» Tilta stellt neue, ausziehbare Schulterpolster-Baseplate vor
von marty_mc - Mi 9:44
» Eckpunkte einer neuen Filmförderung: mehr Kreativität, weniger Bürokratie?
von Alex - Mi 8:31
» Was macht einen Film erfolgreich?
von 7River - Mi 7:20
» Schnittrechner
von n8shift - Mi 1:28