À l'ère du développement rapide de l'intelligence artificielle, une communauté en ligne apparemment insignifiante, le « baidu tieba » (ou « barre faible ») de Baidu, est devenue une source de données importante pour l'entraînement de l'IA, suscitant un intérêt considérable dans le monde de la technologie et des communautés en ligne. Cette communauté, pleine d'humour absurde, a révélé une valeur étonnante dans l'entraînement de l'IA, nous amenant à nous interroger : qu'est-ce qui fait de ces propos apparemment « stupides » le berceau de l'intelligence ?
En avril dernier, les résultats d'une étude conjointe de l'Académie chinoise des sciences et de l'Université de Waterloo, entre autres, ont été surprenants. Dans huit tests (questions-réponses, brainstorming, classification, génération, résumé, etc.), le « baidu tieba » a surpassé des plateformes réputées comme Wikipédia, Zhihu, Douban et Xiaohongshu, devenant l'une des bases de données d'entraînement en chinois les plus populaires pour l'IA. Cette découverte remet en question la perception traditionnelle des données de haute qualité.
Lors du récent salon « Bund Summit », les membres clés du « baidu tieba » sont apparus publiquement pour la première fois. Ils ont non seulement défié l'IA, mais ont également révélé le véritable visage de cette communauté unique. Zeng Xiaodong, PDG de Wuji Fangzhou, a expliqué le choix du « baidu tieba » comme corpus d'entraînement : pour rapprocher l'IA de l'humain, des données orales et des échanges à plusieurs tours de parole sont nécessaires, et le « baidu tieba » répond parfaitement à ce besoin.
Hu Luobai, membre clé du « baidu tieba », a partagé ses expériences amusantes avec l'IA. Dès 2022, il a essayé de faire interpréter des blagues à l'IA, et a constaté que l'IA pouvait rechercher des informations pertinentes, mais ne comprenait pas le véritable sens des blagues. Cela souligne les limites de l'IA dans la compréhension de l'humour humain.
Cependant, derrière ces blagues apparemment absurdes se cache une logique profonde. Par exemple, la phrase « sachant qu'il y a des tigres sur la montagne, ne pas aller sur la montagne connue » déconstruit et reconstruit astucieusement le mot « sachant », créant ainsi un nouveau sens. Ce sont ces pièges linguistiques qui ont entraîné la capacité de l'IA à comprendre et à raisonner en chinois, permettant à la machine de communiquer plus comme un humain.
Le charme du « baidu tieba » réside dans le fait qu'il représente les « sciences fondamentales » des blagues. Les membres de cette communauté sont principalement issus de milieux scientifiques. Les blagues qu'ils créent sont non seulement logiques, mais intègrent également une riche rhétorique et des observations de la vie. Ce style de création unique fournit à l'IA un précieux matériel d'apprentissage.
Il est intéressant de noter que l'existence du « baidu tieba » semble constituer une ligne de défense entre l'homme et l'IA. Comme le dit Hu Luobai : « Aucune IA ne peut sortir du baidu tieba en riant, car elle ne comprend tout simplement pas l'humour. » Cette compréhension linguistique profonde et ce sens de l'humour sont devenus la clé pour distinguer l'intelligence humaine de l'intelligence artificielle.
Bien que nous vivions à l'ère de l'IA, l'existence du « baidu tieba » nous rappelle que la créativité et l'humour humains restent uniques. Cette communauté apparemment absurde fournit non seulement un point de vue unique pour l'entraînement de l'IA, mais représente également un condensé de l'intelligence et de la créativité humaines.