ViTPose

Conjunto de modelos ViTPose basados en Transformer

Producto ComúnImagenInteligencia ArtificialVisión por Computadora

ViTPose es una serie de modelos de estimación de postura humana basados en la arquitectura Transformer. Aprovecha la poderosa capacidad de extracción de características de Transformer para proporcionar una base simple y efectiva para la tarea de estimación de postura humana. Los modelos ViTPose muestran un excelente rendimiento en múltiples conjuntos de datos, con alta precisión y eficiencia. Este modelo es mantenido y actualizado por la comunidad de la Universidad de Sydney, ofreciendo versiones de diferentes tamaños para satisfacer las necesidades de diversas aplicaciones. En la plataforma Hugging Face, los modelos ViTPose están disponibles de forma open source para que los usuarios puedan descargarlos e implementarlos fácilmente para investigación y desarrollo de aplicaciones relacionadas con la estimación de postura humana.

Abrir sitio web

ViTPose Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

ViTPose Tendencia de visitas

ViTPose Distribución geográfica de las visitas

ViTPose Fuentes de tráfico

ViTPose Alternativas

ViTPose — Conjunto de modelos ViTPose basados en Transformer

Imagen

•Inteligencia Artificial•Visión por Computadora

234

VideoWorld — VideoWorld es un modelo generativo profundo que explora el aprendizaje de conocimiento a partir de videos sin etiquetas.

Video

•Inteligencia Artificial•Visión por Computadora

408

FlagAI — Proyecto de código abierto integral de algoritmos, modelos y herramientas de optimización de modelos grandes.

Noticias de IA

IA Diario

Cronología de la IA

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

ViTPose

ViTPose Situación del tráfico más reciente

ViTPose Tendencia de visitas

ViTPose Distribución geográfica de las visitas

ViTPose Fuentes de tráfico

ViTPose Alternativas

ViTPose — Conjunto de modelos ViTPose basados en Transformer

VideoWorld — VideoWorld es un modelo generativo profundo que explora el aprendizaje de conocimiento a partir de videos sin etiquetas.

FlagAI — Proyecto de código abierto integral de algoritmos, modelos y herramientas de optimización de modelos grandes.

CHOIS — Técnica de síntesis de interacción humano-objeto basada en modelos de difusión condicional

LLaMA-Mesh — Unificación de modelos de lenguaje y generación de mallas 3D

JavaVision — Proyecto de reconocimiento inteligente visual integral basado en Java

getalfi.com — Plataforma SaaS empresarial con IA

Lucha R&D — Desafío de resistencia de lucha libre que combina IA y visión por computadora

Herramientas de IA para Product Hunt — Tienda sin personal, sin colas

Robovision.ai — Plataforma de IA de visión por computadora

Visión por Computadora con DirectAI — Cree poderosos modelos de visión por computadora sin necesidad de código ni datos de entrenamiento

Academia OpenAI — Ayuda a los educadores a utilizar eficazmente la inteligencia artificial mediante el conocimiento y las habilidades.

HeroUI Chat — Utilice la IA para convertir sus ideas en realidad y generar aplicaciones atractivas.

Agno — Una biblioteca ligera para construir agentes multimodales.

AccVideo — Modelo de difusión de video acelerado, velocidad de generación aumentada en 8.5 veces.

Video-T1 — Mejora significativamente la calidad de generación de video mediante la escala de tiempo de prueba.

LHM — Modelo de reconstrucción humana 3D de alta fidelidad y animable, genera rápidamente personajes animados.

Fin-R1 — Modelo de lenguaje grande para el razonamiento financiero impulsado por el aprendizaje por refuerzo.

Mixun T1 — El primer modelo de inferencia Mamba híbrido a gran escala de la industria, con una potente capacidad de inferencia.

Hun Yuan T1 — Modelo de inferencia profunda líder en la industria, optimizado para las preferencias humanas.

Reka Flash 3 — Un modelo de inferencia general de 21B parámetros, adecuado para aplicaciones de baja latencia.

o1-pro — El modelo o1-pro mejora su capacidad de inferencia compleja mediante el aprendizaje por refuerzo, proporcionando respuestas óptimas.

Orpheus TTS — Un sistema de texto a voz de código abierto, dedicado a lograr una naturalización del habla humana.

Mistral Small 3.1 — Modelo de código abierto que mejora la capacidad de procesamiento de tareas de texto y visión.

Cohere Command — Cohere Command es un modelo de lenguaje de alto rendimiento diseñado para empresas.

OpenJobs IA — Una plataforma inteligente que ayuda a los usuarios a encontrar trabajo.

Thera — Un método de superresolución de escala arbitraria sin aliasing.

Cal AI APP — Realiza un seguimiento sencillo de las calorías mediante fotos.

Light-R1 — Light-R1 es un proyecto de código abierto centrado en el razonamiento de cadenas largas (Long COT), que proporciona un método de entrenamiento desde cero mediante SFT, DPO y RL.

Gemini Robotics — Modelo robótico basado en Gemini 2.0, que lleva la IA al mundo físico, con capacidades visuales, lingüísticas y de movimiento.