Dans le domaine de l'intelligence artificielle, le problème des « hallucinations » des grands modèles de langage est un défi majeur pour l'industrie. Récemment, les résultats d'un test basé sur le système d'évaluation HHEM-2.1-Open ont révélé des performances remarquables pour le modèle GLM-4-9B de Zhihu AI.

Les données du test montrent que parmi les 85 grands modèles de langage évalués, GLM-4-9B a obtenu la première place avec un taux de cohérence factuelle de 98,7 % et un taux de réponse de 100 %. Il est particulièrement important de noter que son taux d'hallucination est seulement de 1,3 %, un résultat non seulement meilleur que tous les autres, mais aussi supérieur à ceux des modèles GPT d'OpenAI et Gemini de Google.

Robot, métavers, science-fiction

Source : Image générée par IA, Midjourney.

Cette avancée majeure marque un progrès important pour les grands modèles de langage chinois en matière de réduction du taux d'« hallucinations », ouvrant de nouvelles perspectives pour améliorer la fiabilité et la précision des applications d'IA. Cela témoigne non seulement de la puissance technologique de Zhihu AI en matière de développement de modèles, mais établit également une nouvelle référence pour le secteur mondial de l'IA.

Dans le contexte actuel de la compétition de plus en plus intense dans le domaine de l'IA, les excellentes performances du modèle GLM-4-9B attireront sans aucun doute davantage l'attention sur Zhihu AI, et permettront également aux entreprises chinoises d'IA de gagner en influence sur la scène internationale.