近年、具象知能(Embodied AI)が急激に注目を集めています。春節の晩餐会でのロボットの華麗なパフォーマンスから、政府活動報告への記載、そしてNVIDIAのジェンスン・フアン氏による何度も繰り返される推奨まで、AI分野の焦点となっています。具象知能は、ロボットが人間のように現実世界で正確に認識し、柔軟に対応することを目指しています。

清華大学とアリババ傘下のAnt Groupの研究チームが大きなブレークスルーをもたらしました。彼らはICLR2025で発表された論文の中で、BodyGenアルゴリズムフレームワークを提案しました。このフレームワークは強化学習と深層ニューラルネットワーク技術を組み合わせることで、ロボットが短時間で環境に適応した最適な形態と制御戦略を自動的に進化させることができます。実測性能は60%向上し、コードはGitHubでオープンソース化されています。

QQ20250325-144947.png

従来のロボット設計は、多くの課題に直面していました。例えば、膨大な専門知識への依存、特定の環境に対する繰り返し実験による反復、形態制御協調設計技術における巨大な形態探索空間、形態と制御戦略の深いカップリングなどです。BodyGenフレームワークは、形態設計と環境相互作用の2段階を通して、これらの課題を効果的に解決します。形態設計段階では、Transformer(GPTスタイル)の自己回帰を使用してロボットの形状構造パラメータを構築および最適化します。環境相互作用段階では、Transformer(BERTスタイル)を使用して関節情報を処理し、環境との相互作用フィードバックを実現します。

QQ20250325-144954.png

BodyGenには3つの主要な技術があります。形状構造位置エンコーダーTopoPEはロボットの「身体感覚」システムのようなもので、AIが形態変化に迅速に適応するのを支援します。TransformerベースのMoSATは「脳の中枢」のようなもので、情報処理と命令送信を担当します。そして、特別な報酬割り当てメカニズムにより、AIは設計決定を合理的に評価します。

QQ20250325-145003.png

這い回る、泳ぐなど10種類の異なるタスク環境でのテストにおいて、BodyGenによって生成されたロボットの形態適応性スコアは、既存の最良の方法よりも60.03%向上しました。さらに、パラメータ数はわずか1.43Mと軽量で、リソースが限られた環境での利点が顕著です。今後、研究チームは実際のシナリオでの応用を推進し、BodyGenは汎用具象知能の発展に大きく貢献する可能性があります。

アドレス:https://github.com/GenesisOrigin/BodyGen