SMPLer-X

大規模データと大規模言語モデルに基づく人体姿勢と形状推定モデル

一般製品生産性人体姿勢推定形状推定
SMPLer-Xは大規模データと大規模言語モデルに基づく人体姿勢と形状推定モデルであり、身体、手、顔の動きを統合的に捉えることができ、幅広い用途があります。本モデルは32種類の異なるシーンのデータセットを体系的に研究し、最適化されたトレーニング方案とデータセットを選択することで、EHPS能力の顕著な向上を実現しました。SMPLer-XはVision Transformerを用いてモデルを拡張し、ファインチューニング戦略によって専門家モデルに変換することで、性能をさらに向上させています。本モデルはAGORA(107.2 mm NMVE)、UBody(57.4 mm PVE)、EgoBody(63.6 mm PVE)、EHF(ファインチューニングなしで62.3 mm PVE)など、複数のベンチマークテストで優れた性能を発揮しています。SMPLer-Xの利点は、多様なデータソースに対応でき、優れた汎化能力と移植性を持つことです。
ウェブサイトを開く