腾讯混元大模型：斩获“图生文”多模态理解国内大模型第一

腾讯混元大模型在中文多模态大模型SuperCLUE-V测评基准8月榜单中表现卓越，荣获国内大模型排名第一，位于卓越领导者象限。多模态理解，即模型需准确识别图像元素、理解其关系，并生成自然语言描述，考验了模型对图像识别的精确度及对复杂现实世界的理解力。

此次测评包括了12个国内外具有代表性的多模态理解大模型，评估内容包括基础能力和应用能力两大方向。腾讯混元大模型在这两方面均展现出综合优势，获得71.95的高分。SuperCLUE的评估标准涵盖理解准确性、回应相关性和推理深度等，确保了评估的科学性和公正性。

微信截图_20240808103707.png

评测结果显示，国内大模型在多模态理解的基础能力上已接近海外顶尖模型，腾讯混元大模型在应用能力上表现尤为突出，得益于对中文语境的深刻理解及多领域的综合能力。

腾讯混元大模型的技术底座支持AI原生应用腾讯元宝，使其具备多模态理解能力，能够理解并分析多种类型图片。此外，腾讯混元多模态模型已在腾讯云上线，提供图片生文等能力，供企业及个人开发者调用。

腾讯公司副总裁蒋杰表示，混元大模型正在向全模态技术发展，用户将很快能在腾讯元宝App和腾讯内部业务中体验到相关技术，并通过腾讯云向外部应用开放。目前，腾讯混元大模型已扩展至万亿级参数规模，采用混合专家模型（MoE）结构，多模态理解能力达到国内领先水平。

AI新闻资讯