近日,腾讯元宝APP迎来了一次重要升级,新增了“看图说话”功能。这一功能的加入,标志着腾讯元宝在图像理解领域取得了显著进展。

据了解,腾讯元宝此次升级的核心在于“混元+DeepSeek”双模聚合技术的应用。过去,DeepSeek主要扮演的是信息提取的角色,类似于“扫描仪”。但在腾讯混元多模态技术的加持下,如今的DeepSeek已经能够真正理解图片中的细节、氛围,甚至是隐藏的含义。这一转变使得腾讯元宝能够“看懂”图片,并给出自己的分析和解读。

值得注意的是,“看图说话”功能在关闭联网搜索的情况下依然可以使用,这进一步增强了其独立性和实用性。除了“看图说话”,腾讯元宝还支持文件解析、联网搜索公众号或视频号内容、微信上传文件等多种功能,满足了用户在不同场景下的需求。

微信截图_20250221102958.png

在腾讯元宝中,用户还可以根据具体场景和业务需要,选择适合的“AI大脑”。例如,DeepSeek-R1满血版或混元T1适合进行深度思考,而DeepSeek-V3和腾讯混元Turbo则能够快速给出答案。这种灵活的选择方式,使得腾讯元宝能够更好地适应不同的应用场景。

为了展示“看图说话”功能的强大,腾讯元宝还对梵高的《星夜》进行了解读。通过这一功能,用户可以更加深入地了解艺术作品背后的细节和含义,提升了对艺术的理解和欣赏能力。

腾讯元宝的此次升级,不仅提升了其在图像理解领域的实力,也为用户带来了更加便捷、智能的使用体验。未来,随着技术的不断进步和应用场景的不断拓展,腾讯元宝有望在更多领域发挥重要作用,为用户创造更多价值。