audio2photoreal

Génère des avatars humains photoréalistes à partir d'audio

Produit OrdinaireImageIASynthèse vocale
audio2photoreal est un projet open source permettant de générer des avatars photoréalistes à partir d'enregistrements audio. Il inclut une implémentation PyTorch capable de synthétiser des images de visages humains en conversation à partir d'audio. Le projet fournit le code d'entraînement et de test, des modèles de mouvement pré-entraînés, et un accès à des jeux de données. Ses modèles comprennent un modèle de diffusion pour le visage, un modèle de diffusion pour le corps, un modèle VQ-VAE pour le corps et un modèle de transformateur guidé par le corps. Ce projet permet aux chercheurs et développeurs d'entraîner leurs propres modèles et de générer des avatars réalistes de haute qualité basés sur la synthèse vocale.
Ouvrir le site Web

audio2photoreal Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

audio2photoreal Tendance des visites

audio2photoreal Distribution géographique des visites

audio2photoreal Sources de trafic

audio2photoreal Alternatives