Une étude récente révèle que les lecteurs ont du mal à distinguer les poèmes écrits par des humains de ceux générés par l'intelligence artificielle. Plus surprenant encore, de nombreux participants ont même mieux évalué les poèmes créés par l'IA que ceux d'auteurs célèbres. Cette recherche, menée par Brian Porter, chercheur postdoctoral à l'université de Pittsburgh et son équipe, a été publiée cette semaine dans Nature Scientific Reports.
Légende : Image générée par IA, fournie par Midjourney
L'équipe de recherche a sélectionné dix poètes célèbres de la littérature anglaise, dont Geoffrey Chaucer, William Shakespeare et Walt Whitman, et a rassemblé des œuvres littéraires couvrant près de 700 ans. Pour explorer les différences entre l'IA et la poésie humaine, les chercheurs ont utilisé le modèle ChatGPT 3.5 d'OpenAI pour générer cinq poèmes pour chaque poète. Il est important de noter que ces poèmes générés n'ont subi aucune sélection humaine ; les chercheurs ont directement utilisé les cinq premiers poèmes générés par le modèle.
L'étude s'est déroulée en deux parties. La première partie a impliqué 1634 participants. Ils ont été répartis aléatoirement parmi les poètes et ont lu dix poèmes dans un ordre aléatoire : cinq générés par l'IA et cinq écrits par des humains. Les participants devaient identifier l'auteur de chaque poème (IA ou humain). Les résultats ont montré que les participants étaient plus enclins à considérer les poèmes générés par l'IA comme étant d'origine humaine, tandis qu'ils attribuaient à tort l'origine humaine aux poèmes écrits par des humains.
La deuxième partie de l'étude a impliqué près de 700 participants qui ont évalué la qualité, l'esthétique, l'émotion, le rythme et l'originalité des poèmes selon 14 critères. Les participants ont été répartis aléatoirement en trois groupes : un groupe a été informé que les poèmes étaient d'origine humaine, un autre que les poèmes étaient créés par l'IA, et le dernier groupe n'a reçu aucune information. Les résultats ont montré que les participants n'ayant reçu aucune information ont généralement attribué des notes plus élevées aux poèmes générés par l'IA, tandis que ceux qui savaient que les poèmes étaient créés par l'IA leur ont attribué des notes plus basses.
Les chercheurs indiquent que ces résultats suggèrent que les participants utilisent des critères de jugement courants mais peu fiables pour distinguer les poèmes de l'IA et ceux écrits par des humains. La simplicité relative des poèmes générés par l'IA pourrait les rendre plus accessibles aux non-spécialistes, ce qui expliquerait leur préférence pour les œuvres de l'IA et leur mauvaise interprétation de la complexité des poèmes humains comme étant dénuée de sens. Cette étude montre que les capacités de l'IA en matière de création poétique ont atteint un niveau tel qu'il est presque impossible de distinguer ses œuvres de celles des humains.
Points clés :
🌟 L'étude révèle que les lecteurs ont du mal à distinguer les poèmes écrits par des humains et ceux créés par l'IA, et qu'ils préfèrent souvent les seconds.
📊 Les participants ont souvent confondu les poèmes générés par l'IA avec des poèmes écrits par des humains.
📉 Les participants ont généralement attribué des notes plus élevées aux poèmes de l'IA qu'aux poèmes humains, surtout lorsqu'ils ne connaissaient pas l'auteur.