AIチャットボットがソーシャルジャッジメントテストで人間を凌駕、ソーシャルインタラクションアドバイザーとなる可能性

最近のScientific Reports誌に掲載された研究によると、高度なAIチャットボットの中には、複雑な社会的状況の評価において人間を上回るものがあることが示されました。

研究者たちは、広く用いられている心理学的手法である状況判断テストを用いて、Claude、Microsoft Co pilot、you.comのインテリジェントアシスタントという3つのチャットボットが、最も効果的な行動を選択する点で、人間の参加者よりも優れた成績を収めたことを発見しました。

AIロボットによる論文作成

画像出典：AI生成画像、画像ライセンスプロバイダーMidjourney

社会的な交流がますます重要になる中、AIは顧客サービスやメンタルヘルスのサポートなど、様々な分野での社会的相互作用において可能性を示しています。大規模言語モデル（今回の研究でテストされたチャットボットなど）は、言語を処理し、文脈を理解し、効果的な応答を提供することができます。以前の研究では、これらのモデルが学術的な推論や言語タスクにおいて能力を持っていることが証明されていましたが、複雑な社会的ダイナミクスにおける有効性は十分に解明されていませんでした。

研究チームは、高学歴のパイロット志願者276名を対象にテストを実施しました。状況判断テストを用い、評価が必要な12の状況を示し、それぞれの状況に対して4つの潜在的な行動選択肢を提供しました。研究者たちは5つのAIチャットボットの成績を比較し、テストされたすべてのチャットボットが少なくとも人間と同等、場合によってはそれ以上の成績を収めたことを発見しました。中でもClaudeが最高の成績を収め、次いでMicrosoft Co pilotとyou.comのインテリジェントアシスタントが続きました。

興味深いことに、チャットボットが最適な反応を選択しなかった場合でも、多くの場合、2番目に効果的な選択肢を選択しており、人間の意思決定パターンと類似していることが示唆されました。これは、AIシステムは完璧ではないものの、社会的判断と確率的推論において一定の能力を持っていることを示しています。

さらに、研究では、異なるAIシステム間の信頼性の違いも明らかになりました。Claudeは複数のテストで最も高い一貫性を示した一方、Google Geminiはテストによって矛盾する評価結果を示す可能性がありました。それにもかかわらず、すべてのAIシステムの全体的なパフォーマンスは予想を上回り、社会的スキルに関するアドバイスを提供する可能性を示唆しています。

研究者たちは、多くの人がすでに日常的なタスクでチャットボットを使用しているものの、複雑な社会的相互作用の状況におけるパフォーマンスについては、さらなる検証が必要だと指摘しています。研究によると、大規模言語モデルはシミュレートされた社会的状況では優れたパフォーマンスを示しますが、真の社会的行動に不可欠な真の感情は持っていません。

要点：
🌟 AIチャットボットは複雑な社会的判断において人間を上回り、社会的アドバイザーとしての可能性を秘めている。
🧠 本研究では複数のチャットボットのパフォーマンスを比較し、ClaudeとMicrosoft Co pilotが優れた成績を示した。
⚖️ AIシステムはシミュレーションされた状況では良好なパフォーマンスを示すものの、現実の社会的相互作用における応用についてはさらなる研究が必要である。