ViTPose es una serie de modelos de estimación de postura humana basados en la arquitectura Transformer. Aprovecha la poderosa capacidad de extracción de características de Transformer para proporcionar una base simple y efectiva para la tarea de estimación de postura humana. Los modelos ViTPose muestran un excelente rendimiento en múltiples conjuntos de datos, con alta precisión y eficiencia. Este modelo es mantenido y actualizado por la comunidad de la Universidad de Sydney, ofreciendo versiones de diferentes tamaños para satisfacer las necesidades de diversas aplicaciones. En la plataforma Hugging Face, los modelos ViTPose están disponibles de forma open source para que los usuarios puedan descargarlos e implementarlos fácilmente para investigación y desarrollo de aplicaciones relacionadas con la estimación de postura humana.