Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum News-Kommentare-Forum

Infoseite // Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Newsmeldung von slashCAM:



Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...



Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei


Space


Antwort von Frank Glencairn:

Mit Ton:

https://twitter.com/i/status/1780858602703446229

Space


Antwort von 7River:

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.

Space


Antwort von Frank Glencairn:

Was schwebt dir da vor? Sprechende Steckbriefe?

Space


Antwort von Tscheckoff:

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767

Space


Antwort von 7River:

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Space


Antwort von MK:

7River hat geschrieben:
Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.

Space


Antwort von Frank Glencairn:

7River hat geschrieben:
Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.

Space


Antwort von 7River:

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.

Space



Space


Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum News-Kommentare-Forum

Antworten zu ähnlichen Fragen //


KI generiert erschreckend exakte Portraits - nur anhand der Stimme
Slog, Luts & realistische Hauttöne?
Audiodatei ins Internet laden
Ich mach heut noch ein paar Portraits
ReplaceAnything - KI ersetzt und ergänzt Produktbilder und Portraits in hoher Qualität
EMO - KI lässt Portraits sprechen und singen
KI generiert virtuelle Kamerafahrten aus Photos
Aus Text wird nun auch Audio: Stable Audio generiert Musik und Soundeffekte per KI
Nach der Bild- die Videorevolution: Neue KI "Make-a-Video" generiert Videos nach Text
Leaving the Frame - wie aus einer Weltreise ein selbstfinanzierter Kinofilm entstand (gedreht mit der GH5)
Grundausrüstung für Blogs aus einer Praxis
Horror/Mystery Kurzfilm Blinder Himmel -- (fast) alles aus einer Hand
"Live aus dem Leitz-Park": Leica R-Objektive an einer Leica L-Mount Kamera
Video enhance AI Tool: Videos selbst hochinterpolieren - aus SD wird HD, aus HD wird 4K
Microsoft speichert "Superman" auf Glas - über 1.000 Jahre lesbar
Bildqualität steuern beim Livestream über Microsoft Teams?
ARRI und RED Medien unter Windows nicht mehr lesbar - Microsoft UDF Probleme




slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash