Basta uma foto estática e um áudio para o VASA-1 da Microsoft criar um avatar Tek

O novo modelo da Microsoft é capaz de criar avatares hiper-realistas a partir de uma foto estática e de um ficheiro de áudio, com vídeos onde a sincronização dos lábios, a expressão e movimentos são assustadoramente reais. Basta uma foto estática e um áudio para o VASA-1 da Microsoft criar um avatar

O💥️ VASA -1 foi anunciado esta semana e dá um passo importante na criação de avatares realistas, em vídeo, a partir de elementos estáticos. O modelo da Microsoft Research pode criar vídeos de dimensão 512x512 pixels a 45 fps, em tempo real.

Para começar basta partir de uma foto estática e de um clipe de áudio. 💥️O modelo trata de ajustar o posicionamento, a sincronização do movimento dos lábios com o som e os movimentos e expressões do rosto.  E é possível personalizar a direção do olhar, assim como o nível de emoção transmitido.

💥️Veja as imagens

No post publicado no site da Microsoft Research 💥️os investigadores explicam o desenvolvimento e mostram vídeos de vários exemplos, com imagens geradas a partir do StyleGAN2 ou do DALL·E-3.

💥️Veja o vídeo

Na publicação é feita a ressalva sobre os riscos e a utilização responsável da tecnologia, explicando que foi desenvolvida para aplicações positivas e não para ser usada de forma a enganar, como em informação falsa e deepfakes.

Pode aceder à informação do VASA-1 através deste link.

O que você está lendo é [Basta uma foto estática e um áudio para o VASA-1 da Microsoft criar um avatar Tek].Se você quiser saber mais detalhes, leia outros artigos deste site.

Wonderful comments

    Login You can publish only after logging in...