Le modèle Tencent HunYuan : Premier modèle linguistique de grande envergure chinois dans la compréhension multimodale

Le grand modèle linguistique HunYuan de Tencent a démontré des performances exceptionnelles dans le classement d'août du benchmark SuperCLUE-V, un benchmark chinois de modèles multimodaux de pointe. Il a obtenu la première place des grands modèles nationaux, se positionnant dans le quadrant des leaders exceptionnels. La compréhension multimodale, qui exige que le modèle identifie précisément les éléments d'une image, comprenne leurs relations et génère une description en langage naturel, met à l'épreuve la précision de la reconnaissance d'image du modèle et sa capacité à comprendre le monde réel complexe.

Cette évaluation comprenait 12 grands modèles de compréhension multimodale nationaux et internationaux représentatifs, l'évaluation portant sur deux aspects : les capacités de base et les capacités applicatives. Le grand modèle linguistique HunYuan de Tencent a démontré des avantages globaux dans ces deux domaines, obtenant un score élevé de 71,95. Les critères d'évaluation de SuperCLUE couvrent la précision de la compréhension, la pertinence des réponses et la profondeur du raisonnement, garantissant ainsi la scientificité et l'objectivité de l'évaluation.

微信截图_20240808103707.png

Les résultats de l'évaluation montrent que les grands modèles nationaux ont atteint un niveau proche de celui des modèles de pointe étrangers en termes de capacités de base de compréhension multimodale. Le grand modèle linguistique HunYuan de Tencent se distingue particulièrement par ses capacités applicatives, grâce à sa profonde compréhension du contexte chinois et à ses capacités multidomaines.

Le socle technologique du grand modèle linguistique HunYuan de Tencent supporte l'application native d'IA Tencent Yuanbao, lui conférant des capacités de compréhension multimodale, permettant ainsi d'analyser et de comprendre différents types d'images. De plus, le modèle multimodale HunYuan de Tencent est disponible sur Tencent Cloud, offrant des fonctionnalités telles que la génération de texte à partir d'images, accessibles aux développeurs professionnels et individuels.

Jiang Jie, vice-président de Tencent, a déclaré que le grand modèle linguistique HunYuan est en passe de devenir une technologie multimodale complète. Les utilisateurs pourront bientôt expérimenter cette technologie sur l'application Tencent Yuanbao et dans les services internes de Tencent, et elle sera également accessible aux applications externes via Tencent Cloud. Actuellement, le grand modèle linguistique HunYuan de Tencent a étendu son échelle à des milliards de paramètres, utilisant une architecture de modèle d'expert mixte (MoE), atteignant un niveau de compréhension multimodale parmi les meilleurs en Chine.

Actualités IA

Le modèle Tencent HunYuan : Premier modèle linguistique de grande envergure chinois dans la compréhension multimodale « image-texte »

AIbase基地

Recommandations d'actualités IA connexes

Plateforme nationale d'internet de supercalcul intégrée au grand modèle linguistique Qwen d'Alibaba : API QwQ-32B disponible

Le grand modèle de raisonnement Ali Tongyi Qianwen QwQ-32B prend la tête du classement de la communauté open source mondiale

Babel, le grand modèle linguistique open source d'Alibaba, prend en charge 25 langues et touche 90% de la population mondiale

Intégration complète des avatars intelligents de Tencent Cloud au grand modèle DeepSeek pour une expérience utilisateur améliorée