腾讯混元大模型在中文多模态大模型SuperCLUE-V测评基准8月榜单中表现卓越,荣获国内大模型排名第一,位于卓越领导者象限。多模态理解,即模型需准确识别图像元素、理解其关系,并生成自然语言描述,考验了模型对图像识别的精确度及对复杂现实世界的理解力。

此次测评包括了12个国内外具有代表性的多模态理解大模型,评估内容包括基础能力和应用能力两大方向。腾讯混元大模型在这两方面均展现出综合优势,获得71.95的高分。SuperCLUE的评估标准涵盖理解准确性、回应相关性和推理深度等,确保了评估的科学性和公正性。

微信截图_20240808103707.png

评测结果显示,国内大模型在多模态理解的基础能力上已接近海外顶尖模型,腾讯混元大模型在应用能力上表现尤为突出,得益于对中文语境的深刻理解及多领域的综合能力。

腾讯混元大模型的技术底座支持AI原生应用腾讯元宝,使其具备多模态理解能力,能够理解并分析多种类型图片。此外,腾讯混元多模态模型已在腾讯云上线,提供图片生文等能力,供企业及个人开发者调用。

腾讯公司副总裁蒋杰表示,混元大模型正在向全模态技术发展,用户将很快能在腾讯元宝App和腾讯内部业务中体验到相关技术,并通过腾讯云向外部应用开放。目前,腾讯混元大模型已扩展至万亿级参数规模,采用混合专家模型(MoE)结构,多模态理解能力达到国内领先水平。