ノルウェーのスタートアップ企業1X Technologiesは最近、人工知能に基づいたロボットの世界モデル開発において大きな進歩を遂げたことを発表しました。簡単に言うと、これらのモデルはロボットの仮想的なテスト場のようなもので、様々な状況下でロボットをテストし、改良することができます。実地テストは一切不要です。
1Xは、これが「ロボット問題」を解決する鍵だと考えています。「ロボット問題」とは、絶えず変化する環境の中で、様々なタスクのために訓練されたロボットを確実に評価する方法です。例えば、Tシャツを折り畳むことができるロボットを考えてみましょう。このロボットは50日間でパフォーマンスが一定せず、成功体験はすぐに消えてしまうことがよくあります。
1Xによると、同じロボットモデルであっても、環境の変化によってパフォーマンスに大きなばらつきが生じるため、現実的な厳格な評価が非常に困難になります。
世界モデルを訓練するために、1Xは数千時間分のビデオデータを収集しました。これらのデータは、同社の人型ロボットEVEが家庭やオフィスで様々なタスクを実行する様子を記録したものです。機械学習を通じて、モデルは現在、ロボットの行動による物体や環境の反応を合理的に予測できるようになりました。明確にプログラミングされていない行動であっても、人間や物体に触れるのを避けるべきだと学習するなど、モデルは信頼できる画像出力を生成できます。
現在、1Xのモデルは、物体の掴み上げや持ち上げ、ドアや引き出しの開閉、衣服のような変形可能な素材の処理、さらにはTシャツの折り畳みなど、いくつかの複雑な物理的な相互作用を処理できるようになっています。
彼らの世界モデルの中核となる価値は、物体の相互作用をシミュレートすることです。例えば、今後の世代では、モデルは同じ初期画面と、箱を掴むための3つの異なる動作セットを受け取ります。それぞれのケースで、掴まれた箱は機械アームの動作に伴って持ち上げられ移動しますが、他の箱は元の位置にとどまります。
それにもかかわらず、1Xはいくつかの制限も認めています。例えば、モデルは物体の色や形状の一貫性を維持するのが難しい場合や、物理現象を正確にシミュレートできない場合があります。鏡の中の自分自身を認識する能力もまだ信頼性が低いです。
課題は残るものの、1Xはこれらの世界モデルを、汎用ロボットの開発と訓練における重要なマイルストーンと考えています。進捗を加速させるため、同社は「1X世界モデルチャレンジ」を通じて、データセット、事前学習済みモデル、賞金を提供しています。
1Xの長期的な目標は、世界モデルを直接ロボットの訓練に利用することです。これは、現実のテストよりもはるかに効率的です。この目標を実現するために、同社は人工知能分野の専門家を積極的に募集しています。今年初め、1Xは家庭用人型ロボットNeoの市場投入を促進するため、1億ドルの資金調達に成功しました。この資金調達はOpenAIなどの業界のリーダーから支援されており、1Xの技術に対する高い期待を示しています。
1X以外にも、NVIDIAは人型ロボットに多額の投資を行っています。同社は最近、Apple Vision Proを使用する訓練方法を発表しました。NVIDIAの研究者Jim Fanは、今後数年間でロボット工学が「GPT-3モーメント」を迎えるだろうと考えています。