Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum News-Kommentare-Forum

Infoseite // Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Newsmeldung von slashCAM:



Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...



Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei


Space


Antwort von Frank Glencairn:

Mit Ton:

https://twitter.com/i/status/1780858602703446229

Space


Antwort von 7River:

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.

Space


Antwort von Frank Glencairn:

Was schwebt dir da vor? Sprechende Steckbriefe?

Space


Antwort von Tscheckoff:

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767

Space


Antwort von 7River:

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Space


Antwort von MK:

7River hat geschrieben:
Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.

Space


Antwort von Frank Glencairn:

7River hat geschrieben:
Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.

Space


Antwort von 7River:

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.

Space



Space


Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum News-Kommentare-Forum

Antworten zu ähnlichen Fragen //


Audiodatei ins Internet laden
Ich mach heut noch ein paar Portraits
ReplaceAnything - KI ersetzt und ergänzt Produktbilder und Portraits in hoher Qualität
Aus Text wird nun auch Audio: Stable Audio generiert Musik und Soundeffekte per KI
Vidu 1.5 generiert Videoclips aus bis zu 3 vorgegebenen Bildinhalten
Grundausrüstung für Blogs aus einer Praxis
Horror/Mystery Kurzfilm Blinder Himmel -- (fast) alles aus einer Hand
"Live aus dem Leitz-Park": Leica R-Objektive an einer Leica L-Mount Kamera
Nach der Bild- die Videorevolution: Neue KI "Make-a-Video" generiert Videos nach Text
Pyramid Flow - Neue Open Source Video-KI generiert mit 1280 x 768 und 24fps
LTX Video - Neue Open Source KI generiert Videos schneller als in Echtzeit
ARRI und RED Medien unter Windows nicht mehr lesbar - Microsoft UDF Probleme
Microsoft mit generativen KI-Modellen für jedermann im Browser - Bing Image Creator
Microsoft bietet ab sofort kostenlose KI-Bildgenerierung per Edge Browser
Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion
Microsoft will Windows 11 komplett in die Cloud verlagern




slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash