ViTPose

基于Transformer实现的ViTPose模型集合

普通产品图像计算机视觉人体姿态估计

ViTPose是一系列基于Transformer架构的人体姿态估计模型。它利用Transformer的强大特征提取能力，为人体姿态估计任务提供了简单而有效的基线。ViTPose模型在多个数据集上表现出色，具有较高的准确性和效率。该模型由悉尼大学社区维护和更新，提供了多种不同规模的版本，以满足不同应用场景的需求。在Hugging Face平台上，ViTPose模型以开源的形式供用户使用，用户可以方便地下载和部署这些模型，进行人体姿态估计相关的研究和应用开发。

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

ViTPose

ViTPose 最新流量情况

ViTPose 访问量趋势

ViTPose 访问地理位置分布

ViTPose 流量来源

ViTPose 替代品

ViTPose — 基于Transformer实现的ViTPose模型集合

VideoWorld — VideoWorld是一个探索从无标签视频中学习知识的深度生成模型。

FlagAI — 一站式大模型算法、模型及优化工具开源项目

CHOIS — 基于条件扩散模型的人类-物体交互合成技术

PSHuman — 从单张图片重建逼真的3D人体模型

LLaMA-Mesh — 3D网格生成与语言模型的统一

Tencent-Hunyuan-Large — 业界领先的开源大型混合专家模型

Shangchen Zhou — 专注于计算机视觉和机器学习领域的研究与创新的博客网站

SAM 2 — 下一代视频和图像实时对象分割模型。

L4GM — 4D重建模型，快速生成动画对象

Ai online course — 提供关于人工智能的最佳资源，学习机器学习、数据科学、自然语言处理等。

JavaVision — 基于Java的全能视觉智能识别项目

ObjectDrop — 一种通过计数事实数据集和自举监督实现真实物体删除和插入的方法

T-Rex2 — 通用视觉-语义物体检测，无需任务特定调优

FineControlNet — 用于精细文本控制图像生成的空间对齐文本注入

getalfi.com — 企业AI SaaS平台

Wrestle R&D — AI与计算机视觉结合的摔跤耐力挑战

AttentionKart — 通过人工智能提供参与度分析平台

OpenCV — 实时优化的计算机视觉库

Zolak — 提供创新的3D家具可视化软件，提升客户的购物体验。

Product Hunt AI Tools — 无人商店，无需排队

Robovision.ai — 计算机视觉AI平台

Landing.ai — 云端计算机视觉软件平台

Computer Vision with DirectAI — 无需代码或训练数据即可建立强大的计算机视觉模型

AccVideo — 加速视频扩散模型，生成速度提升 8.5 倍。

Video-T1 — 通过测试时间缩放显著提升视频生成质量。

Gemini 2.5 — Gemini 2.5 是谷歌最智能的 AI 模型，具备推理能力。

LHM — 高保真可动画 3D 人类重建模型，快速生成动画角色。

Fin-R1 — 通过强化学习驱动的金融推理大模型。

混元T1 — 业界首个超大规模混合 Mamba 推理模型，强推理能力。