スタンフォード大学の李飛飛教授率いるチームが、シーンレベルの全シーン生成を実現するZeroNVSという技術を発表しました。
この技術は、自然で多様な画像を生成するための「3D知覚拡散モデル」と呼ばれる手法を採用しています。LPIPSなどの指標を用いた評価において、ゼロショット性能で注目すべき成果を上げています。
この技術的ブレークスルーは、AIが単一の画像から360度全シーンの画像を生成できることを示しており、仮想現実やゲーム開発などの分野に大きな影響を与えるでしょう。
スタンフォード大学の李飛飛教授率いるチームが、シーンレベルの全シーン生成を実現するZeroNVSという技術を発表しました。
この技術は、自然で多様な画像を生成するための「3D知覚拡散モデル」と呼ばれる手法を採用しています。LPIPSなどの指標を用いた評価において、ゼロショット性能で注目すべき成果を上げています。
この技術的ブレークスルーは、AIが単一の画像から360度全シーンの画像を生成できることを示しており、仮想現実やゲーム開発などの分野に大きな影響を与えるでしょう。
人工知能の急速な発展を背景に、AI大規模言語モデルの研究開発と応用は活況を呈しています。最近、この分野における複数の企業や機関の最新動向が広く注目を集めています。まず、ChatGPTが登場する前のNVIDIAの時価総額倍率はウォール街で大きな注目を集め、専門家らは、これが2008年のアップルの成功神話を再現する兆候かもしれないと考えています。同時に、国泰君安の最高情報責任者である俞楓氏は、AI大規模言語モデルの台頭により証券業界が「インテリジェント認知」時代に入るだろうと述べています。