ViTPose est une série de modèles d'estimation de pose humaine basés sur l'architecture Transformer. En exploitant la puissante capacité d'extraction de caractéristiques du Transformer, il offre une solution simple et efficace pour l'estimation de pose humaine. Les modèles ViTPose affichent d'excellentes performances sur plusieurs ensembles de données, alliant haute précision et efficacité. Ce modèle, maintenu et mis à jour par la communauté de l'Université de Sydney, propose différentes versions de tailles variables pour répondre aux besoins de divers scénarios d'application. Sur la plateforme Hugging Face, les modèles ViTPose sont disponibles en open source, permettant aux utilisateurs de télécharger et de déployer facilement ces modèles pour la recherche et le développement d'applications liées à l'estimation de pose humaine.