SMPLer-X
基于大数据和大模型的人体姿态和形状估计模型
普通产品生产力人体姿态估计形状估计
SMPLer-X是一种基于大数据和大模型的人体姿态和形状估计模型,能够统一捕捉身体、手和面部的运动,并具有广泛的应用。该模型通过对32个不同场景的数据集进行系统研究,优化训练方案并选择数据集,从而实现了对EHPS能力的显著提升。SMPLer-X采用Vision Transformer进行模型扩展,并通过微调策略将其转化为专家模型,从而进一步提高性能。该模型在多个基准测试中均表现出色,如AGORA(107.2 mm NMVE)、UBody(57.4 mm PVE)、EgoBody(63.6 mm PVE)和EHF(62.3 mm PVE without finetuning)。SMPLer-X的优势在于能够处理多样化的数据源,具有出色的泛化能力和可迁移性。