AIが直面する「死の挑戦」：ロボットに象を冷蔵庫に入れるよう指示

AIbase基地

公開日AIニュース · 1 分で読めます · Aug 15, 2024

AIが溢れる現代において、私たちはインテリジェントアシスタントへの要求をますます高めています。流暢な会話能力だけでなく、画像認識能力、そしてユーモアのセンスも求められています。しかし、AIに矛盾する指示を与えたらどうなるか、考えたことはありますか？例えば、「象を冷蔵庫に入れなさい。ただし、象は冷たくなってはいけない」という指示です。AIは戸惑うのではないでしょうか？

AIの「耐圧力」をテストするために、研究者たちは「大冒険」を始めました。「Self-Contradictory Instructions（SCI）」と呼ばれるテストで、まさにAI界の「デスチャレンジ」です。このテストには、言語と視覚の両分野を網羅した2万個もの矛盾する指示が含まれています。例えば、猫の写真を見せて「犬」を説明させるとか。これはAIを困らせるための試練です。

この「デスチャレンジ」をさらに刺激的にするために、研究者たちはAutoCreateという自動データセット作成フレームワークを開発しました。このフレームワークは、まるで疲れを知らない出題教師のように、大量の高品質で多様な問題を自動生成します。AIは大変です。

これらの理解しがたい指示に、AIはどう対応するのでしょうか？研究者たちはAIに「覚醒剤」を投与しました。それはCognitive Awakening Prompting（CaP）と呼ばれる方法です。この方法は、AIに「矛盾検出器」を取り付けたようなもので、指示処理をよりスマートに行えるようにします。

研究者たちは、人気の大規模マルチモーダルモデルをいくつかテストしました。その結果、これらのAIは矛盾する指示に直面すると、まるで戸惑う大学の新入生のように振る舞いました。しかし、CaP方法を使用すると、まるで急に理解したかのように、成績が大幅に向上しました。

この研究は、AIの新しいテスト方法を提供するだけでなく、AIの将来の発展方向を示唆しています。現在のAIは矛盾する指示の処理においてまだ不器用な子供のようなものですが、技術の進歩に伴い、将来のAIはより賢くなり、矛盾に満ちた複雑な世界にうまく対応できるようになると確信しています。

いつか、AIに「象を冷蔵庫に入れなさい」と指示したとき、「承知しました。象を氷像にして冷蔵庫に入れます。こうすれば、冷蔵庫の中にあるのに冷たくなりません」とスマートに答える日が来るかもしれません。

論文アドレス：https://arxiv.org/pdf/2408.01091

プロジェクトページ：https://selfcontradiction.github.io/

AIの火眼金睛！Finer-CAMでAIによる画像理解をより正確に、分類をより明確に

人工知能は画像認識分野で非常に盛んです。猫や犬の分類などはもう時代遅れで、今では「連想ゲームPlus版」のような、例えばある特定の年式の特定のモデルのスポーツカーであること、あるいはある鳥の眉毛が隣の家の王さんの眉毛よりもわずかに太いかどうかなどを瞬時に識別することが流行しています。しかし、問題はあります。ニューラルネットワークは賢いのですが、「なぜこれがこれだと判断したのか？」を説明しようとすると、まるでテストで解法を説明できない生徒のように、支離滅裂でまともな説明ができません。従来のClass Activation Map（クラス活性化マップ）は…

DeepSeek連携による企業微信、ワンクリックで7×24時間対応の企業向け「インテリジェントアシスタント」を実現

2月21日、企業微信の新バージョンが正式にリリースされ、インテリジェントロボット、インテリジェント表計算（顧客フォローアップサマリー）などのAI機能が正式にリリースされ、フルバージョンのDeepSeek-R1大規模モデルが段階的に導入されました。企業は内部ナレッジベースに基づいた専用の「インテリジェントアシスタント」をワンクリックで作成でき、顧客フォローアップ状況をワンクリックで自動的に要約することもできます。AIを活用することで、企業内での協業と顧客サービスの効率を大幅に向上させることができます。DeepSeek連携によるインテリジェントロボット：開発不要で企業専用の「万能アシスタント」を作成今回のアップデートでは、企業微信で「インテリジェント」が全面的にリリースされました。

蘇州政府外部ネットワークにDeepSeek大規模言語モデルの展開が成功、デジタル行政インテリジェントアシスタントが稼働開始

先日、蘇州市政府外部ネットワークにおいて、DeepSeek R1671B大規模言語モデルの全機能展開が完了しました。これは、蘇州におけるデジタル行政サービスにおける重要な一歩を意味します。今回の展開は、各政府部門および関連部門により効率的でインテリジェントなサービスを提供し、行政の透明性とサービス品質をさらに向上させることを目的としています。新システムの稼働開始と同時に、蘇州数字科技集団はDeepSeekなどの大規模言語モデルに基づいた「デジタル行政インテリジェントアシスタント」を開発・発表しました。この革新的なアプリケーションは、行政サービスナレッジベースを…

AIニュース

AIが直面する「死の挑戦」：ロボットに象を冷蔵庫に入れるよう指示

AIbase基地

関連AIニュースの推奨

AIの火眼金睛！Finer-CAMでAIによる画像理解をより正確に、分類をより明確に

ロサンゼルス・タイムズ、AIによる記事見解分析導入でメディアへの信頼危機を招く

DeepSeek連携による企業微信、ワンクリックで7×24時間対応の企業向け「インテリジェントアシスタント」を実現

蘇州政府外部ネットワークにDeepSeek大規模言語モデルの展開が成功、デジタル行政インテリジェントアシスタントが稼働開始