slashCAM
Administrator
Administrator
Beiträge: 11279

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 4723

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1384

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 4723

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4426

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 4723

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» Juan Melara FilmUnlimited
von Axel - So 12:58
» Portkeys LH5C - 800 Nits und Kamerasteuerung für 222 Euro
von slashCAM - So 10:24
» Apple plant OLED-MacBook Pro, Mac Studio M6 Ultra und Mini-LED Studio Display
von Da_Michl - So 9:05
» Panasonic beendet LUMIX PRO Service
von Da_Michl - So 7:33
» SanDisk stellt Extreme Fit vor: Aktuell kleinster 1TB USB-C-Speicherstick
von Jott - Sa 19:51
» Canon EOS R5C Kamera -neuwertig OVP + Smalrig Black Mamba Kit
von matth3s - Sa 14:57
» RØDECaster Video S: Kompakte Produktionskonsole für Video und Audio
von Darth Schneider - Sa 9:52
» Mit Filmen GELD verdienen (Filminvests): Mit UWE BOLL
von 7River - Fr 18:12
» HONORARE & HONORARGRÖßEN im Film: Mit Florian Tessloff
von Nigma1313 - Fr 13:15
» Canon EOS C50 im Praxistest: Kompaktes Arbeitstier mit 7K 50p Raw - die neue FX3 Konkurrenz
von Rick SSon - Fr 12:43
» Alien: Romulus - Teaser Trailer online - produziert von Ridley Scott, gedreht auf Alexa 35
von Jott - Fr 6:37
» Sony FX3 Nachfolger: Wie wichtig ist Open Gate wenn ein elektronisch verstellbarer ND Filter möglich wäre?
von Mikkel - Fr 1:42
» Linsen (Vintage, Anamorphic & Co.)
von Funless - Do 17:13
» Nikon ZR Lesertester gesucht! Nikon ZR zu gewinnen
von j.t.jefferson - Do 14:21
» DJI Neo 2: Kompakte Selfie-/FPV-Drohne mit Rundum-Hinderniserkennung und 4K/100p
von slashCAM - Do 13:36
» Behind the Scenes - Gute Sammlung
von iasi - Do 10:08
» Täglich über 15 Millionen US-Dollar Verlust? Sora 2 kommt OpenAI teuer zu stehen
von iasi - Mi 21:38
» ARRI Film Lab: Bewährte Color Science als OpenFX-Plugin
von Darth Schneider - Mi 19:23
» Sony Xperia VII und FX3 / FX6
von j.t.jefferson - Mi 18:09
» Synchronisation mehrerer Kameras mit Unterbrechungen
von j.t.jefferson - Mi 16:17
» Datacolor SpyderX Pro unterstützt jetzt 3D-LUTs und Content Credentials
von dienstag_01 - Mi 12:09
» Das Audio ducking will nicht funktionieren
von Aloha - Mi 9:09
» ARRI Film Lab
von Clemens Schiesko - Di 23:07
» Middle Control 3.0 - Sony Kameras via ATEM steuern
von rush - Di 22:08
» Canon EOS R6 Mark III mit 32,5 MP-Sensor, 7K Raw 50/60p und Open Gate Aufnahme vorgestellt
von roki100 - Di 20:52
» Orbsmart R82 mit ZDMC AnzeigeWerbung
von Nvidia 3D - Di 18:17
» Neues Apple TV Intro - Logo aus Glas statt KI und CGI
von Darth Schneider - Di 16:03
» Frankenstein
von Darth Schneider - Di 7:21
» DJI Avata 360 - Leaks zeigen DJIs neue 360°-Drohne
von slashCAM - Mo 22:33
» DJI Air 3 Fly more Combo mit RC-N3 Controller
von v-empire - Mo 22:13
» Explosion bei Speicherpreisen? NAND und DRAM weltweit stark nachgefragt
von rush - Mo 16:12
» iPhone 17 Pro Max mit ProRes RAW - Rolling Shutter und Dynamik Sensortest
von Axel - Mo 15:54
» Workflow: 4K-Ausschnitt aus 8K?
von Jost - Mo 11:15
» Adobe Firefly Video-Editor angekündigt - Timeline-basierte KI-Cliperstellung
von slashCAM - Mo 9:36
» Verkaufe fast neuwertige Fuji X-M5 Kit mit 15-45 Objektiv
von v-empire - So 22:24