最近、Waymoは自動運転分野で大きな一歩を踏み出しました。同社はこれまで、Google DeepMindとの協業を競争優位性としてきました。そして今、Googleのマルチモーダル大規模言語モデルGeminiを活用し、自動運転タクシーのトレーニング効果を高めています。
Waymoは新たな研究論文を発表し、「EMMA」と呼ばれる「エンドツーエンド・マルチモーダルモデル」を紹介しました。このモデルはセンサーデータ処理を行い、自動運転車の将来の走行軌跡を生成します。これは、Waymoの無人運転車両がより賢く走行判断を行い、障害物を効果的に回避できることを意味します。
この新技術の重要性は、その革新性だけでなく、現在の大規模言語モデルの適用範囲を変える可能性がある点にもあります。WaymoはMLLMを自動運転システムの「一等公民」と見なしたいと考えており、これは将来の自動運転が現在のチャットボットや画像生成器とは大きく異なる可能性を示唆しています。
この論文では、従来の自動運転システムは、知覚、マッピング、予測、計画など、様々な機能のために特定の「モジュール」を開発することが一般的であると述べられています。この方法は過去数年で一定の進歩を遂げましたが、特に新しい複雑な環境に対応する際には限界があることも明らかです。Waymoは、GeminiのようなMLLMがこれらの問題を解決できると考えています。なぜなら、それらは幅広い「世界知識」を持ち、「連鎖思考推論」を行い、人間の論理的推論を模倣できるからです。
EMMAモデルは、Waymoの自動運転タクシーが複雑な環境でナビゲーションを行うために開発されました。例えば、動物や道路工事などに遭遇した場合、EMMAは無人運転車が最適な走行経路を見つけるのに役立ちます。しかし、WaymoはEMMAにもいくつかの限界があることを認識しており、例えば、現在ではLiDARやレーダーからの3Dセンサー入力は処理できません。
Waymoはこの分野の研究をさらに深める必要がありますが、この成果が、現在存在する問題に対処し、自動運転技術の発展を促進するためのさらなる研究を促すことを期待しています。
要点:
🚗 WaymoはGoogleのGeminiモデルを利用して、新しい自動運転タクシーのトレーニングシステムEMMAを開発し、意思決定能力を向上させています。
🌍 EMMAモデルは複雑なセンサーデータ処理を行い、無人運転車両が障害物を賢く回避するのに役立ちます。
🔍 EMMAには可能性がありますが、Waymoは既存の限界を克服するためにさらなる研究が必要であることを認めています。