Une étude récente, publiée dans Scientific Reports, révèle que certains chatbots IA avancés surpassent les humains dans l'évaluation de situations sociales complexes.
Utilisant un outil de psychologie largement répandu, le test de jugement situationnel, les chercheurs ont constaté que trois chatbots – Claude, Microsoft Copilot et l'assistant intelligent de you.com – ont surpassé les participants humains en matière de choix de réactions comportementales les plus efficaces.
Source : Image générée par IA, fournie par Midjourney.
Avec l'importance croissante des interactions sociales, le potentiel de l'IA dans ce domaine se précise, notamment dans les services clients et le soutien en santé mentale. Les grands modèles linguistiques (comme les chatbots testés dans cette étude) peuvent traiter le langage, comprendre le contexte et fournir des réponses efficaces. Bien que des études précédentes aient démontré leurs capacités en matière de raisonnement académique et de tâches linguistiques, leur efficacité dans les dynamiques sociales complexes restait à explorer.
L'équipe de recherche a testé 276 participants humains, des candidats pilotes hautement qualifiés. L'étude a utilisé un test de jugement situationnel présentant 12 situations à évaluer, chacune offrant quatre options comportementales possibles. Les chercheurs ont comparé les performances de cinq chatbots IA, découvrant que tous les chatbots testés étaient au moins aussi performants que les humains, voire meilleurs. Claude a obtenu les meilleurs résultats, suivi de Microsoft Copilot et de l'assistant intelligent de you.com.
Il est intéressant de noter que lorsque les chatbots ne choisissaient pas la meilleure réaction, ils optaient souvent pour la deuxième option la plus efficace, montrant une similitude avec les schémas de décision humains. Cela suggère que les systèmes d'IA, bien qu'imparfaits, possèdent une certaine capacité de jugement social et de raisonnement probabiliste.
De plus, l'étude a révélé des différences de fiabilité entre les différents systèmes d'IA. Claude a démontré la cohérence la plus élevée sur plusieurs tests, tandis que Google Gemini a pu présenter des résultats contradictoires selon les tests. Néanmoins, les performances globales de tous les systèmes d'IA ont dépassé les attentes, démontrant leur potentiel en matière de conseils sur les compétences sociales.
Les chercheurs soulignent que, bien que de nombreuses personnes utilisent déjà les chatbots dans leurs tâches quotidiennes, leurs performances dans des scénarios d'interaction sociale complexes nécessitent une validation supplémentaire. L'étude montre que les grands modèles linguistiques excellent dans des contextes sociaux simulés, mais ils ne possèdent pas d'émotions réelles, essentielles à une véritable interaction sociale.
Points clés :
🌟 Les chatbots IA surpassent les humains dans le jugement social complexe et présentent un potentiel en tant que conseillers sociaux.
🧠 L'étude compare les performances de plusieurs chatbots, révélant l'excellence de Claude et de Microsoft Copilot.
⚖️ Bien que les systèmes d'IA fonctionnent bien dans des contextes simulés, leur application dans les interactions sociales réelles nécessite des recherches supplémentaires.