Google、110億パラメーターの基盤ワールドモデルGenieを発表

雪球App

公開日AIニュース · 1 分で読めます · Feb 27, 2024

143

2月26日、Google DeepMindチームは基礎世界モデル「Genie」を発表しました。これは、110億パラメーターを持つ、インタラクティブに操作可能な仮想環境を生成するモデルです。ビデオデータを与えて学習させることで、写真、スケッチ、さらには操作可能な仮想世界を生成します。Genieは、アクションラベルを一切使用せずに学習されました。従来のAIは、人間が画像にラベル付けしてAIに画像認識を学習させる必要がありましたが、Genieはビデオから独自に様々なアクションの特徴とパターンを認識する必要があります。Genieが生成するビデオはカートゥーン調で、ロボットのアクションや物体の変形をシミュレートでき、SoraよりもGIFアニメーションに近い特性を持っています。Googleは、Genieは細粒度の制御を学習できる挑戦的なモデルであり、インターネット上のビデオから学習すると述べています。また、Genieは様々な潜在的なアクションをシミュレートし、生成された環境に基づいて異なるアクションを推測することもできます。

AI大規模言語モデル業界の動向：新技術と連携の継続的な推進

人工知能の急速な発展を背景に、AI大規模言語モデルの研究開発と応用は活況を呈しています。最近、この分野における複数の企業や機関の最新動向が広く注目を集めています。まず、ChatGPTが登場する前のNVIDIAの時価総額倍率はウォール街で大きな注目を集め、専門家らは、これが2008年のアップルの成功神話を再現する兆候かもしれないと考えています。同時に、国泰君安の最高情報責任者である俞楓氏は、AI大規模言語モデルの台頭により証券業界が「インテリジェント認知」時代に入るだろうと述べています。