Une étude récente révèle qu'il est possible de construire une architecture capable de simuler avec précision le comportement humain dans divers contextes en utilisant des modèles d'IA générative, notamment les grands modèles linguistiques (LLM). Cette découverte offre un nouvel outil puissant pour la recherche en sciences sociales.

Les chercheurs ont commencé par recruter plus de 1 000 participants aux États-Unis, issus de divers milieux, et leur ont fait passer des entretiens approfondis de deux heures pour recueillir des informations sur leurs expériences de vie, leurs opinions et leurs valeurs. Ils ont ensuite utilisé ces transcriptions d'entretiens et un grand modèle linguistique pour construire une « architecture d'agents génératifs ».

image.png

Cette architecture permet de créer des milliers de « clones » virtuels à partir des entretiens des participants, chaque « clone » possédant une personnalité et des schémas comportementaux uniques. Les chercheurs ont évalué les performances de ces « clones » à l'aide d'une série de tests standardisés en sciences sociales, tels que le « Big Five » et des jeux d'économie comportementale.

De manière surprenante, les performances de ces « clones » aux tests étaient très cohérentes avec celles des participants réels. Ils étaient non seulement capables de prédire avec précision leurs réponses aux questionnaires, mais aussi leurs réactions comportementales lors d'expériences. Par exemple, dans une expérience sur l'influence du pouvoir sur la confiance, les « clones » ont montré le même comportement que les participants réels : le niveau de confiance du groupe ayant le plus de pouvoir était nettement inférieur à celui du groupe ayant le moins de pouvoir.

image.png

Cette étude montre que les modèles d'IA générative peuvent être utilisés pour créer des « humains virtuels » très réalistes et pour prédire le comportement humain réel. Cela offre une méthode totalement nouvelle pour la recherche en sciences sociales. Par exemple, il est possible d'utiliser ces « humains virtuels » pour tester l'efficacité de nouvelles politiques de santé publique ou de stratégies marketing, sans avoir besoin de mener des expériences à grande échelle sur des personnes réelles.

Les chercheurs ont également constaté que le recours aux seules informations démographiques pour construire des « humains virtuels » est insuffisant. Seule la combinaison avec les transcriptions d'entretiens permet de simuler plus précisément les comportements individuels. Cela montre que chaque individu possède des expériences et des opinions uniques, informations essentielles pour comprendre et prédire son comportement.

Afin de protéger la vie privée des participants, les chercheurs prévoient de créer une « banque d'agents » et d'y donner accès de deux manières : un accès ouvert aux données agrégées pour des tâches fixes, et un accès restreint aux données individuelles pour des tâches ouvertes. Cela permettra aux chercheurs d'utiliser ces « humains virtuels » tout en minimisant les risques liés aux transcriptions d'entretiens.

Les résultats de cette étude ouvrent sans aucun doute une nouvelle voie à la recherche en sciences sociales. Il reste à voir quelles seront les conséquences à long terme. Affaire à suivre.

Adresse de l'article : https://arxiv.org/pdf/2411.10109