slashCAM
Administrator
Administrator
Beiträge: 11278

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 24650

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 4085

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 24650

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1295

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 4085

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4426

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 24650

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 4085

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» AI Color Grading in Resolve
von Frank Glencairn - So 13:31
» Blackmagic Cloud Store verliert Google Drive-Synchronisierung
von slashCAM - So 13:06
» DZOfilm Arles - fünf neue Brennweiten verfügbar
von slashCAM - So 10:57
» Erster Trailer zu Francis Ford Coppolas Megalopolis erschienen
von iasi - Sa 15:29
» Storyboard mit AI
von 7River - Sa 10:22
» 7Artisans bringt neue AF-Objektive für E-, Z- und L-Mount
von rush - Sa 7:11
» SmallRig präsentiert kompakte RC 100B COB-LED-Videoleuchte
von Darth Schneider - Sa 4:15
» AI-Diskussionsthread - Pro/Kontra?
von Darth Schneider - Sa 4:11
» Zubehör für Kameras entwickeln und verkaufen - darf man das?
von Bergspetzl - Sa 0:03
» Nanlite PavoSlim 240CL - Kompaktes RGBWW LED-Panel mit 21.000 Lux
von slashCAM - Fr 17:45
» DUNE !
von markusG - Fr 17:29
» Blackmagic URSA Cine 17K 65 wird ca. 30.000 Dollar kosten
von iasi - Fr 17:14
» Canon RF 28-70mm F2.8 IS STM für 1.299 Euro vorgestellt
von slashCAM - Fr 14:27
» Zwangs-Update: Microsoft sägt Windows-Version ab
von MLJ - Fr 14:13
» Accsoon CineView Master: Drahtlose 4K60p-Videoübertragung mit minimaler Latenz
von slashCAM - Fr 12:06
» Sony FX3 und FX30 bekommen Verschlusswinkel und mehr
von cantsin - Fr 11:49
» Globale Streamer investieren verstärkt in nicht-amerikanische Inhalte
von ruessel - Fr 8:57
» Probleme mit Audio-Export in DaVinci Resolve – Ton fehlt bei Wiedergabe über WhatsApp oder Nextcloud!
von Clemens Schiesko - Do 21:39
» Colourlab Ai - IBC Announcement
von Frank Glencairn - Do 19:52
» Panasonic AW-UB50 und AW-UB10 Box Kameras mit Vollformat- oder MFT-Sensor
von stip - Do 18:11
» Was wird Pro an der DJI Osmo 5 außer Super-Zeitlupen?
von medienonkel - Do 15:19
» -SONY FX- Erfahrungsaustausch
von Mantas - Do 13:09
» Neue LUTs für NLOG von Nikon
von soulbrother - Do 11:59
» Adobe präsentiert erstmals KI-generierte Clips per Firefly Video
von slashCAM - Mi 18:09
» DIY Hydrophon: Flüße und Seen in Stereo
von ruessel - Mi 17:38
» Panasonic Objektiv LUMIX LEICA DG VARIO-ELMAR F4,0-6,3/100-400mm Power O.I.S.
von DLW - Mi 17:13
» Follow-Modus? Drohne fliegt rückwärts?
von guntero - Mi 16:52
» 45-Grad Schrägansicht nach vorne, wie fliegen
von guntero - Mi 16:42
» Was kann 32bit-Audio wirklich?
von atomic - Mi 16:20
» Bis zu 1000 Euro Cashback für Kameras und Objektive von Canon und Panasonic
von SamSuffy - Mi 15:32
» DJI Ronin 4D AF Frage
von Cinefreund - Mi 14:31
» Readout Speed für Ursa Cine 12K LF veröffentlicht
von iasi - Mi 14:28
» Z Cam E2G, E2C, E2-6F, E2-S6, E2-F8
von iasi - Mi 14:14
» Canon präsentiert Cinema EOS C80 - Vollformat 6K RAW bis 30p
von Clemens Schiesko - Mi 14:13
» Insta 360 Himmel wirkt unecht
von j.t.jefferson - Mi 12:30