slashCAM
Administrator
Administrator
Beiträge: 11279

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 4556

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1357

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 4556

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4426

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 26509

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 4556

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» Kostenlose Tentacle Music Video Sync App vereinfacht die Musikvideoproduktion
von pillepalle - Do 9:47
» Seit Update auf DaVinci Resolve Studio 20: Problem mit Film Look Creator
von pillepalle - Mi 20:36
» SmallRig x Potato Jet Tribex Stativ, Sennheiser IE 100 Pro, LaCie Ruggend SSD 5 4TB und mehr …
von slashCAM - Mi 11:09
» Blackmagic Camera 9.6: Micro Studio Camera 4K G2 jetzt mit PYXIS-Support
von slashCAM - Mi 10:39
» Gibt es für Actioncams eine Art Anti-Fisheye Linse?
von rush - Mi 9:30
» Star Trek: Third Rate - Fan Film
von Nathanjo - Di 22:35
» Firmware-Updates für die Panasonic Lumix S1RII, S1II und S1IIE
von cantsin - Di 15:37
» Nvidia GeForce RTX 5050 im Anflug - 10 Bit 4:2:2 Decoding für 200 Euro?
von slashCAM - Di 10:24
» Magic Lantern mit deutlichem Lebenszeichen - Frische Motivation und frischer Code
von Da_Michl - Di 9:44
» Bildsensor mit Perowskit verdreifacht mögliche Auflösung
von CotORR - Di 8:48
» 36% mehr DSLMs ausgeliefert im April als im Vorjahr
von iasi - Mo 23:00
» Neuer XAVC-L Standard für ARD/ZDF – Interlacing noch Thema?
von vaio - Mo 21:26
» Higgsfield.ai - Aufwändige Videoeffekte auf Knopfdruck aus der KI-Cloud
von Drushba - Mo 18:34
» Manueller Video Modus nicht mehr erreichbar.
von milesdavis - Mo 15:45
» Rode Wireless Go 3 - Ton zu leise
von rush - Mo 10:49
» BM Micro Studio Camera G2 erhält Pyxis Monitor Kompatibelität
von Darth Schneider - Mo 9:19
» Suche Omnidirektionales Mikrofon-Setup für Sony FX3
von pillepalle - Mo 6:25
» Unzuverlässiger Autofokus HC-X2E
von Jott - So 20:39
» UHD Progressive zu HD Interlaced Workflow - Hardware-Lösung für Preview?
von SonyTony - So 13:06
» Kompakte OM-5 Mark II bekommt zwei neue Bildprofile
von cantsin - So 10:25
» Nikon Z5 II mit interner RAW-Aufzeichnung - Debayering, Rolling Shutter und Dynamik
von cantsin - So 9:09
» Film wurde nur mit Handys gedreht...
von Jott - Sa 20:48
» Insta360 Studio - Bildjustagen verschwunden nach update
von soulbrother - Sa 20:09
» Welche USB-C SSD für 4k120 prores am iPhone 16 Pro?
von Totao - Sa 11:43
» Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...
von Totao - Sa 11:38
» Kleines Schwanenhalsmikro für AVX-Bodypacksenser gesucht
von pillepalle - Fr 16:04
» Magix Video deluxe 2026 und Video Pro X17 mit neuen KI-Funktionen
von slashCAM - Fr 11:45
» Nanlite FM Mount Projektionsaufsatz 18°-36° für präzise Lichtgestaltung
von Darth Schneider - Fr 11:20
» Adobe Firefly jetzt als Smartphone-App - samt Nutzung von Veo 3, Luma und Pika
von peter161170 - Fr 9:14
» Sony FX2 im Praxistest: Erstmalig neigbarer Sucher, Cine-Gehäuse wie FX3, 33 MP Fullframe CMOS
von pillepalle - Fr 7:18
» Panasonic S1RII im Praxistest: Überraschend viele Videofunktionen für Pros
von iasi - Fr 0:18
» Blackmagic Updates für Web Presenter, Video Assist, Cloud und BRAW
von slashCAM - Do 11:27
» Adobe Premiere Pro ab sofort mit 4:2:2 Beschleunigung per Nvidia GPU und mehr
von dienstag_01 - Do 11:03
» Superman | Offizieller Trailer
von 7River - Do 5:11
» Midjourney startet eigene Video-KI V1
von slashCAM - Do 1:09