AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

蚂蚁集团发布面向 DevOps 领域的大模型评测基准

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Nov 2, 2023

蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准 ——DevOps-Eval。该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等 8 个类别的选择题，共计 4850 道题目。此外，还针对 AIOps 任务做了细分，并添加了日志解析、时序异常检测、时序分类和根因分析等任务。评测结果显示各模型得分相差不大。蚂蚁集团表示，未来将继续优化基准，丰富评测数据集，重点关注 AIOps 领域，并增加更多的评测模型。

蚂蚁集团 DevOps 大模型评测

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

蚂蚁集团发布 EnergyTS 大模型提升新能源预测能力

蚂蚁集团旗下的蚂蚁数科正式推出了一款名为 EnergyTS 的能源电力时序大模型。这款模型的发布被业界视为蚂蚁在人工智能领域的重要布局，尤其是在新能源行业的应用。EnergyTS 能够通过精准的预测功能，帮助企业更好地把握发电量和供需情况，从而优化经营策略，提升运营效率。EnergyTS 是为新能源行业量身定制的，专注于电力领域的时序数据处理。模型充分吸收了新能源行业的专业知识，并结合了多种场景的多模态数据。其优势包括多尺度训练、多模态融合和多任务学习等，同时还具备零

2025年3月26号 20:41

1.2k

国产AI芯片崛起！消息称蚂蚁集团训练成本骤降20%，媲美英伟达

据彭博社援引知情人士报道，蚂蚁集团在人工智能领域取得了重大突破，通过采用阿里巴巴和华为生产的中国芯片，成功将AI模型的训练成本削减了20%。这一消息无疑为中国在关键技术领域的自主可控注入了新的动力。报道进一步指出，蚂蚁集团的内部测试显示，这些中国制造的AI芯片在性能上能够与行业领导者英伟达的同类产品相媲美。这一结果如果得到广泛验证和应用，将可能显著改变全球AI芯片市场的格局。图源备注：图片由AI生成，图片授权服务商Midjourney此前，市场曾有传言称中国

2025年3月25号 9:39

2.4k

蚂蚁集团发布两款创新 MoE 大模型，训练成本大幅降低

近日，蚂蚁集团的 Ling 团队在预印版 Arxiv 平台上发布了题为《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展3000亿参数混合专家 LING 大模型》的技术论文，介绍了他们研发的两款新型大语言模型:百灵轻量版（Ling-Lite）和百灵增强版(Ling-Plus)。这两款模型在设计上采用了多项创新，能够在低性能硬件上高效训练，显著降低了成本。百灵轻量版的参数规模为168亿，其中激活参数为27.5亿。而增强版的基座模型则拥有高达2900亿的参数，激活参数为288亿。这两款模型的性能均达到行业领先水平，尤其

2025年3月24号 15:28

3.1k

收购好大夫后新动作，蚂蚁集团面向29万医生推出AI辅助系列产品

蚂蚁集团正加码AI医疗产业布局，3月21日，其对外公布了在医疗机构、医生、用户三端最新AI产品体系升级。其中，面向医疗机构，蚂蚁联合华为医疗卫生军团、阿里云等推出“蚂蚁医疗大模型一体机”全栈式解决方案;面向好大夫在线29万注册医生，发布AI医生助手系列工具;同时，服务用户的健康应用“AI健康管家”也推出智能思考、健康自测等十余项新功能。AI浪潮下，医疗机构对大模型部署需求与日俱增，但在落地与实际应用中，兼顾服务便捷与数据安全、平衡应用性能与投入成本也成

2025年3月21号 16:13

2.7k

蚂蚁入局具身智能赛道：百万年薪招兵买马，自研团队首曝光

蚂蚁集团旗下上海蚂蚁灵波科技有限公司近日启动大规模招聘，首次披露其具身智能人形机器人研发计划。这家成立于2024年底、注册资本1亿元的科技公司，正通过猎聘网集中招募四大核心岗位团队，工作地点包括上海和杭州。招聘信息显示，开放岗位包括人形机器人系统和应用软件工程师、人形机器人硬件结构工程师、人形机器人运动控制软件工程师、人形机器人整机/硬件产品专家，薪资范围在35-80k·16薪。其中，硬件结构工程师需主导机器人关键部件设计，具备3年以上经验及量产产品

2025年2月19号 14:20

3.4k

智谱GLM-4-9B模型幻觉率仅1.3%，在全球大模型评测中夺魁

在人工智能领域，大语言模型的"幻觉问题"一直是困扰业界的关键挑战。近日，一项基于HHEM-2.1-Open评估体系的测试结果显示，智谱AI旗下的GLM-4-9B模型交出了一份令人瞩目的成绩单。测试数据显示，在参与评估的85个大语言模型中，GLM-4-9B以98.7%的事实一致性率和100%的回答率摘得桂冠。特别值得关注的是，该模型的幻觉率仅为1.3%，这一成绩不仅位居榜首，更是超越了行业巨头OpenAI的GPT系列和Google的Gemini系列模型。图源备注：图片由AI生成，图片授权服务商Midjourney这一突破性成果标志着中国大

2025年1月10号 15:49

3.5k

蚂蚁集团发布2024科技生态白皮书：AI 专利方面有大幅提升

蚂蚁集团在其技术官方微博上发布了2024科技生态白皮书。该白皮书的数据更新截至2024年11月底，涵盖了专利、开源、标准、论文以及产学研等五个方面的内容。数据显示，过去一年，蚂蚁集团在科技研发上持续加大投入，尤其是在人工智能（AI）领域，不断扩展科技生态的广度和深度。截至2024年11月底，蚂蚁集团全球专利申请总计达34，576项，其中发明专利占比高达97%。国外专利申请的比例为35%。在申请的专利中，超过10% 的重要专利已在国际上进行了布局，涉及美国、欧洲、新加坡、马来

2024年12月30号 14:58

1.8k

大模型评测平台CompassArena升级推出全新 Judge Copilot 功能

上海人工智能实验室司南OpenCompass团队与魔搭ModelScope联合推出的大模型评测平台CompassArena（大模型竞技场）近日迎来了新升级，旨在为用户提供更科学、全面的模型评估体验。自上线以来，该平台吸引了大量社区用户参与并贡献数据，基于这些数据，CompassArena不断优化，此次升级包括全新Judge Copilot功能和榜单算法的改进，以及新增20多个全新模型。

2024年12月19号 17:47

2.7k

马云谈AI未来:技术重要，但独特价值才决定未来命运

2024年12月8日，马云在蚂蚁集团20周年庆典上发表了精彩的演讲，回顾了互联网时代的机遇，并展望了AI时代的巨大变革。马云表示，20年前，当互联网刚刚兴起时，他和他的同代人非常幸运，抓住了这一历史机遇。但在他看来，未来20年，AI时代的到来将带来前所未有的变革，甚至超出所有人的想象。马云强调，AI将是一个更加伟大的时代，它会改变一切，但他也指出，AI不会决定一切。尽管技术在未来发展中至关重要，但马云认为，真正决定未来胜负的，仍然是今天人类为即将到来的AI时代

2024年12月9号 11:19

3.3k

75%开发者依赖AI工具，但 39% 却对其代码缺乏信任

在近日发布的谷歌2024年《DevOps 状态报告》中，调查显示超过75% 的开发者和 IT 专业人士在日常工作中依赖人工智能（AI）。这项调查由谷歌云的 DevOps 研究与评估(DORA)团队进行，覆盖近3000名全球技术从业者，揭示了 AI 在技术行业的快速普及。图源备注:图片由AI生成，图片授权服务商Midjourney报告中指出，有76% 的受访者表示他们会利用 AI 来进行代码编写、信息总结以及代码解释等任务。而且，有81% 的参与者提到公司已经将资源转向 AI 的开发，表明 AI 正在成为推动技术进步的重要力量。更令

2024年10月25号 17:07

1.5k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图