長年、人型ロボットが人間のように、あるいは人間を超えるほどの柔軟性と自在性を持ち得ることを、人々は夢見てきました。しかし、シミュレーション環境と現実世界の物理的な差異により、ロボットの全身の協調性と敏捷な動作を実現することは、依然として大きな課題となっています。従来のシステム同定やドメインランダム化手法は、煩雑なパラメータ調整が必要であったり、ロボットの動作が過度に保守的になり、敏捷性が犠牲になることがありました。

image.png

今、ASAP(Aligning Simulation and Real Physics)と呼ばれる全く新しいフレームワークが登場し、シミュレーションと現実世界の物理特性を巧みに整合させることで、人型ロボットがより柔軟な全身運動スキルを習得できるようになりました。

ASAPフレームワークは、大きく分けて2つの段階から構成されています。まず、事前学習段階では、研究者らは人間の動作のビデオデータを利用し、これらの動作を人型ロボットに再マッピングした後、シミュレーション環境でロボットにこれらの動作を学習させます。しかし、シミュレーション環境で訓練された戦略をそのまま現実のロボットに適用すると、シミュレーション環境と現実世界との動的な差異により、性能が低下することがあります。

この問題を解決するために、ASAPフレームワークは第二段階である事後学習段階に進みます。この段階では、研究者らはロボットに事前学習で習得した動作を現実世界で実行させ、ロボットの実際の動作軌跡を記録します。

次に、ASAPフレームワークはこれらの現実世界の動作データを使用して、シミュレータ内でロボットの動作を再現します。シミュレーション環境と現実世界には差異があるため、シミュレーションされた動作軌跡は現実の動作軌跡から外れることがよくあります。この差異こそが、研究者にとって学習のシグナルとなります。ASAPは「差分動作モデル」を学習させます。このモデルは、シミュレーションと現実世界の動的な差異を学習し、補正します。このモデルは一種の「修正器」として機能し、シミュレータの不足点を修正して、現実世界の物理特性により近づけます。

最後に、研究者らはこの「差分動作モデル」をシミュレータに統合し、これを使用して事前学習された動作追跡戦略を微調整することで、ロボットの動作が現実世界の物理特性により適応するようにします。微調整後の戦略は、「差分動作モデル」を介することなく、現実世界のロボットに直接展開できます。

ASAPフレームワークの有効性を検証するために、研究者らは、異なるシミュレータ間の移行や、現実の人型ロボットUnitree G1を用いたテストなど、多くの実験を行いました。実験結果は、ASAPフレームワークが様々な動的な動作において、ロボットの敏捷性と全身の協調性を著しく向上させ、従来のシステム同定、ドメインランダム化、動的差分学習手法と比較して、動作追跡誤差を大幅に低減できることを示しています。

ASAPフレームワークの成功は、シミュレーション環境と現実世界の間の動的な差異を効果的に解消できる点にあります。これにより、シミュレーション環境で訓練された人型ロボットが、現実世界で高い敏捷性を発揮できるようになり、より柔軟で多機能な人型ロボットの開発に向けた新たな方向性を示しています。

ASAPフレームワークの主要技術:

人間の動作データを用いた事前学習:人間の敏捷な動作をロボットの学習目標に変換し、ロボットに高品質な動作データを提供します。

差分動作モデルの学習:現実世界とシミュレーション環境の差異を学習することで、シミュレータの不足点を動的に補正し、シミュレーションの精度を高めます。

差分動作モデルに基づく戦略の微調整:ロボットの戦略が現実世界の物理特性に適応し、最終的により高い運動性能を実現します。

ASAPフレームワークの実験検証:

シミュレータ間の移行において、ASAPは動作追跡誤差を大幅に低減し、他の基準手法よりも優れています。

現実のロボットでのテストにおいても、ASAPはロボットの運動性能を大幅に向上させ、ロボットが高難易度の敏捷な動作を実行できるようにします。

本研究では、データセットのサイズ、学習時間、動作ノルムの重み付けなど、差分動作モデルの学習における重要な要素についても深く考察しています。さらに、研究者らは異なる差分動作モデルの使用戦略を比較し、最終的に強化学習による微調整手法が最適な性能を実現することを確認しました。

ASAPフレームワークは目覚ましい進歩を遂げていますが、ハードウェアの制約、モーションキャプチャシステムへの依存、データ量の多さなど、いくつかの限界も存在します。今後の研究方向としては、ハードウェアの損傷を感知できる戦略アーキテクチャの開発、ラベルなしの姿勢推定や機上センサの融合によるモーションキャプチャシステムへの依存の軽減、より効率的な差分動作モデルの適応技術の探求などが挙げられます。

ASAPフレームワークの登場は、人型ロボット分野に新たな希望をもたらしました。シミュレーションと現実世界の動的な差異の問題を巧みに解決することで、ASAPは人型ロボットがより敏捷で協調的な運動スキルを習得することを可能にし、将来の人型ロボットの現実世界における広範な応用のための堅実な基盤を築きました。

プロジェクトアドレス:https://agile.human2humanoid.com/

論文アドレス:https://arxiv.org/pdf/2502.01143