联想问天WA7785a G3服务器创纪录!单机运行671B DeepSeek大模型吞吐量高达6708token/s!

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Mar 17, 2025

252

联想今日宣布，旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B（满血版） DeepSeek 大模型时，实现了高达6708token/s 的极限吞吐量，再次刷新了单台服务器运行超大规模模型性能的纪录。

据介绍，此次性能突破得益于联想万全异构智算平台的强大支持。联想通过访存优化、显存优化、创新的 PCIe5.0全互联架构以及精选 SGLang 框架中的最优算子等一系列创新技术手段，对大模型从预训练、后训练到推理的全流程进行了持续优化。实测结果显示，在单台部署 DeepSeek671B 大模型的联想问天 WA7785a G3服务器上，最高吞吐量达到了惊人的6708token/s。

GPU 芯片 (5)

图源备注：图片由AI生成，图片授权服务商Midjourney

在模拟问题对话场景（上下文序列长度128/1K）时，该服务器最高可支持158的并发数，TPOT(Time Per Output Token)为93毫秒，TTFT(Time To First Token)为2.01秒;而在模拟代码生成场景(上下文序列长度512/4K)时，并发数可达140，TPOT 为100毫秒，TTFT 为5.53秒。联想方面表示，这一性能表现意味着单台联想问天 WA7785a G3服务器即可支撑1500人规模企业的正常使用，是继联想问天 WA7780G3服务器单机部署满血版 DeepSeek 大模型总吞吐量突破2500token/s 之后，在单机部署该大模型推理性能上的又一次重大飞跃。

联想方面强调，此次技术突破是联想中国基础设施业务群、联想研究院 ICI 实验室和 AMD 联合设计、协同调优、共同实现的成果。同时，这并非最终结果，联想与 AMD 仍在持续探索深度调优的新方法，以期实现更高的性能突破。

联想问天WA7785aG3 AMDAI大模型 DeepSeek大模型万全异构智算平台

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

巨人网络发布行业首个DeepSeek原生游戏玩法太空杀推出内鬼挑战

巨人网络宣布旗下社交推理游戏《太空杀》正式接入DeepSeek大模型，并推出基于该技术的原生游戏玩法“内鬼挑战”，目前该玩法已开启灰度测试，后续将面向全量用户开放。这标志着业内首次将DeepSeek大模型能力深度应用于游戏玩法创新，以AI驱动游戏核心玩法，重塑游戏的竞技和交互体验。

2025年3月14号 10:15

2.7k

腾讯元宝功能上新：允许分享长图时是否展示AI思考过程

腾讯元宝是一款支持腾讯混元（Turbo/T1）和DeepSeek(V3/R1)大模型的AI助手工具，用户可以不限量使用其联网搜索和文件解析功能，以提升工作和学习效率。此次更新的核心亮点在于用户可以根据需求选择分享“短图”(仅展示回答结果)或“长图”(包含详细推理过程)，使分享内容更加个性化和多样化。

2025年3月7号 9:16

2.6k

腾讯云智能数智人全面接入DeepSeek大模型提升用户交互体验

近日，腾讯云智能数智人与 DeepSeek 大模型成功实现全面接入，标志着人工智能技术在用户交互体验方面迈出了重要一步。借助 DeepSeek 大模型强大的语义理解和意图识别能力，腾讯云智能数智人在多种应用场景中将更加智能、灵活。这一接入使得腾讯云智能数智人能够在交互、播报等多个领域中提供更为丰富的用户体验，助力其在实际生产和生活中更好地发挥作用。具体来说，用户在使用数智人平台时，无需进行任何开发，只需借助内置的 V3、R1等多种模型及100多种2D 小样本数智人，即可让

2025年3月5号 11:13

2.0k

周鸿祎谈AI幻觉与网络安全:问题不可夸大也不应忽视

在今年全国两会前夕，全国政协委员、360集团创始人周鸿祎就DeepSeek大模型及AI安全问题发表看法，强调正确认识AI安全，既不可夸大也不应忽视。周鸿祎指出，当前AI安全议题需警惕被夸大的趋势。他批评以OpenAI为代表的美国五大AI公司倾向于通过渲染AI不安全来为其垄断和闭源策略辩护，借此推动政府加强监管，阻挠后来者追赶。他认为，这种背景下讨论AI安全有“耍流氓”之嫌，并强调“不发展是最大的不安全”。在他看来，抓住AI工业革命机遇，提升生产力并实现科技普惠，才是当务之

2025年3月4号 11:45

2.0k

腾讯云智能数智人、企点客服全面接入DeepSeek

2月24日，腾讯云智能数智人和腾讯企点客服正式宣布接入DeepSeek大模型，借助其卓越的语义理解和意图识别能力，进一步优化用户体验，提升服务质量和客户满意度。

2025年2月24号 17:10

2.7k

商络电子计划引入DeepSeek大模型，助力AI平台建设

近日，商络电子在互动平台上透露，公司正在积极筹备引入 DeepSeek 大模型，旨在构建一个私有化的人工智能平台。这一举措不仅将为公司在数据分析和预测方面提供强有力的支持，还将提升其辅助决策能力，从而推动整体业务的效率提升。商络电子表示，DeepSeek 大模型的引入将使其能够更有效地处理和分析海量数据。通过对数据的深入分析，商络电子希望能够为管理层提供更加精准的决策支持，帮助公司在竞争日益激烈的市场环境中保持优势。同时，这一 AI 能力的搭建，也将与公司的通

2025年2月21号 9:38

930

联想第三财季营收大增，全球首家部署DeepSeek大模型端侧AI PC

联想集团发布2024财年第三季度财报显示，公司实现营收1351亿元人民币，同比增长20%;净利润49.8亿元人民币，同比增长106%。在交出亮眼业绩单的同时，联想还宣布了重要的AI战略进展。作为全球首家，联想将在AI PC端侧本地部署DeepSeek大模型。此前，公司旗下的联想天禧个人智能体系统（天禧AS）中的小天个人智能体已完成与DeepSeek-R1联网满血版大模型的全面接入，实现了AI PC、手机、平板等核心终端的全面覆盖。在生态建设方面，联想天禧已接入超1700款AI应用，涵盖医疗、法律、教育等多个

2025年2月20号 14:03

1.4k

多地政务服务系统接入DeepSeek大模型服务效率大提升

随着人工智能技术的迅速发展，越来越多的地方政府开始将 AI 引入政务服务，试图通过智能化手段提升服务质量和效率。近期，北京经济技术开发区和深圳福田区纷纷上线了基于 DeepSeek 大模型的智能政务助手，标志着 AI 在政务领域的应用迈出了重要一步。在北京经济技术开发区，新的智能政务小助手经过多家企业的测试后正式投入使用。这个助手不仅能处理咨询工作，还能进行材料审核，极大地缩短了办事时长。其强大的语义理解能力使其能够准确识别用户的需求，真正实现了 “边聊边

2025年2月20号 9:23

1.7k

微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

近日，微信宣布其搜索功能接入 DeepSeek-R1模型，目前处于灰度测试阶段。部分用户在微信搜索框选择 AI 搜索时，可体验到 DeepSeek-R1提供的深度思考功能。微信方面表示，引入大模型旨在提升搜索的智能化和精准度，更好地理解用户搜索意图，分析处理复杂查询。目前，微信搜索已接入包括混元、DeepSeek 在内的大模型，以丰富用户体验。关于数据来源，微信 AI 搜索不仅包含公众号等微信生态内的内容，还整合了全网优质信息，以提供更全面的回答。微信强调，AI 搜索仅使用公众号及互联网

2025年2月19号 11:18

2.8k

途虎回购1128万股A类股份，并完成DeepSeek大模型接入

近日，途虎公司在公告中宣布，根据股东批准的股份回购授权，计划在2024年6月25日至2025年2月14日间，在公开市场回购11284400股 A 类股份。这一回购数量占公司已发行股本的1.38%。值得注意的是，途虎在2024年上半年已累计从市场上回购并注销12286900股 A 类股份，这显示了公司在资本运作上的积极态度。在业务发展的另一个重要方面，途虎近期宣布已成功完成 DeepSeek-R1、V3等人工智能模型的部署，并将这些模型接入到公司的核心业务流程中。这一技术的全面上线将为途虎的运营管理带来显著提

2025年2月17号 15:06

1.1k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图