腾讯混元领跑多模态AI：全方位领先GPT-4/Claude-3.5等

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Aug 8, 2024

401

在人工智能的多模态领域，国产大模型正展现出强劲的实力。最新发布的中文多模态大模型测评基准SuperCLUE-V榜单显示，腾讯的hunyuan-vision和上海AI Lab的InternVL2-40B分别成为国内闭源和开源界的两大领跑者，甚至超越了国际知名的Claude-3.5-Sonnet和谷歌的Gemini-1.5-Pro。

腾讯混元大模型的多模态版本，hunyuan-vision，不仅在API调用上受到开发者的青睐，更在腾讯元宝APP中免费向用户开放体验。元宝APP一直以"实用AI搭子"著称，强调实用易用性，而其在多模态能力上的突破，更是在评测中拿下国内第一的佳绩。

为了更直观地展示国产多模态大模型的进步，我们对腾讯元宝进行了一系列的测试。从梗图表情包理解、照片内容识别到视觉错觉挑战，腾讯元宝都展现出了出色的表现。在实际应用场景中，无论是财报摘要读取、学术图表识别还是行测找规律题，元宝都能够准确理解并给出合理的答案。

▲ 图源“ CLUE 中文语言理解测评基准”公众号，下同

特别是在一道考验对中国文化背景理解的附加题中，腾讯元宝准确识别了《葫芦兄弟》的截图，并正确回答了相关问题，显示出其在理解中文语境方面的优势。

腾讯混元大模型作为一位"老朋友"，自去年9月首次亮相以来，一直保持快速迭代，目前已扩展至万亿参数规模，覆盖文本、多模态理解及生成等领域。在国内大模型中，腾讯混元率先完成MoE架构升级，从单个稠密模型升级到多个专家组成的稀疏模型。

腾讯元宝APP，主打"实用AI搭子"，不仅在多端同步、聊天记录同步方面表现出色，更在多模态理解能力上展现出了强大的实力。无论是文档截图、人像风景、收银小票还是任意照片，元宝都能基于图中内容给出自己的理解和分析。

腾讯元宝团队表示，接下来将把更多精力放在融合模型多模态能力上，进一步提升用户体验。同时，腾讯也在深度搜索和深度长文阅读等方面进行了功能更新，减少了技术细节的暴露，简化了用户操作。

人工智能腾讯 hunyuan-vision 元宝APP

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

多邻国将用人工智能取代合同工，迈向 “AI 优先” 模式

多邻国（Duolingo）近日宣布，将逐步停止使用能够被人工智能(AI)处理的合同工。这一决定是在公司联合创始人兼首席执行官Luis von Ahn向全体员工发出的电子邮件中公布的，标志着该公司将转向 “AI 优先” 的战略。Luis von Ahn 在邮件中提到，成为 “AI 优先” 的公司意味着需要重新思考工作方式，而简单地对现有系统进行微调是无法实现这一目标的。作为这一战略转变的一部分，多邻国将实施一些 “建设性的约束”，包括对合同工的工作方式进行调整，并寻求在招聘和绩效评估中引入 AI。Lu

2025年4月29号 9:35

1.3k

人工智能助力自闭症群体:社交障碍的“解码器”

随着人工智能技术的迅猛发展，AI应用正成为自闭症群体克服社交障碍的重要工具。根据美国疾控中心（CDC）的数据显示，当前美国有超过500万成年人被诊断为自闭症。这一群体通常在解读暗示性言语、非言语交流以及理解复杂社交情境方面面临挑战，而AI的介入为他们提供了前所未有的支持。AI工具帮助自闭症群体理解社交规则34岁的加拿大自闭症教师Theron Pierce在经历突然失业后，发现了一款名为Autistic Translator的AI应用，这款应用帮助他首次清晰地理解了自己在职场中遇到的问题。通过向

2025年4月28号 15:25

5.3k

巨人网络《太空杀》引入腾讯AI技术，生成超700万AI玩家

在最近的游戏技术更新中，巨人网络旗下的《太空杀》正式接入了腾讯的混元大模型。这一新功能不仅为游戏注入了活力，还让游戏体验更加丰富。据巨人网络官方公众号透露，自4月28日推出这一功能以来，已经生成超过700万个 AI 玩家，标志着游戏在 AI 原生玩法上的大胆探索。《太空杀》作为一款社交推理类游戏，其核心玩法是让玩家通过推理与交流来找出 “内鬼”。如今，借助腾讯混元大模型，AI 玩家能够以更加智能的方式参与游戏，不仅提升了游戏的趣味性和挑战性，也让玩家在面

2025年4月28号 11:26

5.4k

摩托罗拉新款Razr手机集成多家 AI 技术，OpenAI 缺席引关注

近日，摩托罗拉发布了其新一代Razr翻盖手机，成为了市场上的新亮点。这款手机不仅在外观上吸引眼球，更在功能上大幅提升，主要依赖摩托罗拉自有的人工智能技术以及来自 Perplexity、谷歌、Meta 和微软等多家公司的 AI 技术。摩托罗拉此举旨在为用户提供更加智能化的使用体验，将人工智能作为产品的一大卖点。图源备注：图片由AI生成，图片授权服务商Midjourney新款Razr手机将于5月15日正式上市，包括Razr、Razr Plus和Razr Ultra三个版本。这三款手机都是首批预装 Perplexity 人工智能应用程序的

2025年4月28号 10:00

1.9k

Meta与英伟达、惠普联手打造太空AI项目 “Space Llama”

在最新的科技突破中，Meta 宣布与英伟达和惠普合作推出名为 “Space Llama” 的人工智能项目。该项目旨在为国际空间站国家实验室的宇航员研究提供支持，利用 AI 技术帮助他们在太空环境中进行更高效的工作。“Space Llama” 项目的核心目标是降低成本，减少计算需求，并能够快速响应宇航员在太空中遇到的各种问题。考虑到在太空中，宇航员无法依赖地球互联网进行数据传输，这一项目的推出无疑具有重要意义。借助这一新系统，宇航员将能够直接在太空中处理数据，从而提升工作效率和

2025年4月28号 9:53

1.9k

巨人网络《太空杀》接入腾讯混元大模型已生成超700万AI玩家

巨人网络旗下社交推理游戏《太空杀》宣布正式接入腾讯混元大模型，这一创新举措标志着游戏行业在AI原生玩法探索上迈出了重要一步。目前，《太空杀》已通过该模型生成超过700万个AI玩家，这些虚拟玩家将与游戏中的2亿真人用户展开激烈的“智斗”，为玩家带来全新的游戏体验。

2025年4月28号 9:19

1.4k

广告行业如何适应AI时代：从Google到ChatGPT的转变

在互联网发展历程中，Google 的崛起几乎是一个传奇。自1999年成立以来，Google 以简洁无广告的搜索体验吸引了大量用户，创始人拉里・佩奇和谢尔盖・布林在早期坚决回避广告，认为广告可能影响搜索质量。然而，到了2000年，Google 为了实现盈利，推出了 AdWords，快速转型为一个依靠广告收入的巨头，广告也逐渐成为搜索结果页面的重要组成部分。然而，随着2022年底 ChatGPT 的问世，Google 的传统广告模式面临前所未有的挑战。ChatGPT 通过直接回答用户问题而非提供链接列表，极大改变了人们

2025年4月28号 9:17

1.3k

清华大学成立人工智能医院迈向智慧医疗新篇章

清华大学正式成立人工智能医院，标志着该校在 “AI + 医疗” 领域迈出了重要一步。4月26日，清华大学举行了人工智能医院的揭牌仪式，并在医学院全体教职工大会上进行了相关介绍。校长李路明、副校长王宏伟等多位领导出席了此次仪式，共同见证了这一历史性时刻。清华大学人工智能医院（Tsinghua AI Agent Hospital）将分阶段建设，初期将依托北京清华长庚医院及其互联网医院进行试点。这一新医院将结合清华大学在人工智能领域的全面布局和多学科医工交叉的优势，旨在推动医疗服务的

2025年4月27号 13:50

6.0k

全球首部AI生成电影《海上女王郑一嫂》上映时长70分钟

近日，由新加坡影视制作公司FizzDragon出品的70分钟华语AIGC（人工智能生成内容）电影《海上女王郑一嫂》正式在新加坡院线上映，成为全球首部进入商业院线公映的AI技术长片。该片以18世纪中国传奇女海盗郑一嫂为原型，其人物形象曾启发《加勒比海盗》系列中“清夫人”一角的创作。

2025年4月25号 14:14

7.2k

埃隆・马斯克的 xAI 在孟菲斯引发污染争议

埃隆・马斯克的人工智能公司 xAI 最近在田纳西州孟菲斯引发了争议。这家公司正在该地区建设一台巨大的超级计算机，以支持其业务运营。然而，自从去年夏天超级计算机投入使用以来，社区居民和环保活动家表示，该设施已成为当地主要的空气污染源之一。图源备注：图片由AI生成，图片授权服务商Midjourney针对这一问题，孟菲斯市健康部门已安排于周五举行首次公开听证会，以听取各方意见。在听证会前，一些匿名团体向历史悠久的黑人社区居民发放了声称 xAI 排放量低的宣传单，同时

2025年4月25号 10:40

4.1k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图