3月10日、智元ロボットは初の汎用具象基盤大規模モデル「Genie Operator-1」(略称:GO-1)を発表しました。このニュースは大きな注目を集め、特に家庭用サービスロボットの可能性において、今後の家事管理に新たな希望をもたらすものとして期待されています。智元ロボットの公式発表によると、GO-1大規模モデルは大量の人間の動画を学習することで、コップの水を運ぶ、食事を作る、客を迎えるなど、多くの家事タスクで優れたパフォーマンスを示しました。
技術性能において、GO-1は既存のモデルと比べて顕著な向上を見せており、平均成功率は32%向上しています。テストの結果、GO-1は水を入れる、テーブルを掃除する、飲み物を補充するといった特定のタスクにおいて、より優れた能力を発揮しました。智元ロボットは、この進歩は新たに提案されたVision-Language-Latent-Action(ViLLA)アーキテクチャによるものだと述べており、このアーキテクチャは高品質なデータセットと大量の動画データを利用することで、モデルの汎化能力を向上させることができます。
さらに、智元ロボットは昨年末、複数の機関と共同で、100万件を超える実機データセットプロジェクト「AgiBot World」をオープンソース化することを発表しました。このデータセットは100種類以上の現実世界のシーンを網羅しており、そのうち40%が家庭環境、20%が産業環境です。このデータセットは、ロボットの能力を訓練し向上させるための重要な基盤となります。
智元ロボットは、GO-1大規模モデルの主な特徴として、1. 人間の動画から学習し、人間の行動理解を向上させる、2. 強い少サンプル高速汎化能力を持ち、非常に少ないデータ、あるいはゼロショットで新しいタスクに適応できる、3. 異なるロボット形態間で移行でき、「一脳多形」の柔軟な運用を実現する、ことを強調しています。継続的な進化を通じて、GO-1は実際の運用からデータを取得し、自己能力を継続的に最適化・向上させることができます。
智元ロボットの今回の発表は、家事ロボットが具象知能の普及に向けて重要な一歩を踏み出したことを示しています。信達証券の分析によると、AIの発展は、ヒューマノイドロボットや自動運転などの技術を根本的に推進しており、今後のヒューマノイドロボット産業化の見通しは期待できるとしています。