信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

工具

GEO品牌全景分析

企业级监测平台，全域追踪品牌在 12+ AI 平台的表现

GEO品牌得分检测

输入品牌生成综合健康度得分，快速定位整体位置与短板

GEO排名查询

单次提问，立刻看到品牌在多个 AI 平台回答中的排名

GEO推广链接检测

追踪投放的推广链接，评估哪些渠道真正被 AI 引用

服务

GEO排名优化系统源码

拥有属于自己的GEO系统，助您成为专业GEO优化服务商

GEO 排名优化服务

通过AI搜索优化服务，让品牌在AI中实现霸屏

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

信息

大模型API聚合平台

国内外主流大模型的统一API接入与调用服务

模型库

涵盖各类AI模型，满足你的开发与研究需求

模型供应商

寻找优质模型提供商，获取可靠模型支持

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

“百模大战”家家第一,大模型“跑分”作弊何时休?

罗超频道

发布于AI新闻资讯 · 1 分钟阅读 · Nov 29, 2023

文章分析了当前大模型评测体系中的“跑分乱象”,称大模型榜单广泛存在“家家第一”的情况。现有的开源跑分数据集会引发“刷题”现象;而封闭的私有数据集又会影响公平性。此外,部分榜单的评测维度也不够科学全面。文章建议建立权威的评测体系,开源评测工具与流程以保证公平,但评测数据集则采用开放历史+封闭正式的模式。此外,大模型的商业化远比模型的参数和榜单排名更为重要。

大模型评测大模型跑分大模型应用

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

千问APP首发灰测HappyHorse 可一键做TVB港风短片

4月27日，阿里千问APP灰度测试视频模型HappyHorse，用户点击首页下方按钮即可体验。该模型在叙事能力、音画同步及风格多样性上表现突出，内测期间已生成大量TVB港风、央视三国风、老电影风短片。用户可通过Prompt一键制作同款，尤其擅长剧情类视频，仅需简单描述即可自动生成多镜头内容。

2026年4月27号 21:00

100

震惊好莱坞！你刷到的热门大片，背后竟是中国AI在“打工”

近日，亚马逊剧集《大卫王朝》中73个特效镜头由生成式AI完成，技术来自中国快手公司，为剧组节省大量外景和后期成本。这一案例表明，AI视频生成技术正加速渗透影视制作，引发行业对成本、效率及传统工作模式的关注。

2026年4月27号 17:17

OpenAI 推出 Privacy Filter：全新 PII 脱敏模型开源上线

OpenAI发布Privacy Filter模型，旨在帮助开发者脱敏文本中的个人身份信息（PII）。该模型参数规模1.5亿，采用混合专家（MoE）设计，以Apache 2.0协议在Hugging Face和GitHub开源。其核心优势在于深度语言理解能力，能通过上下文识别非结构化文本中的敏感信息，超越传统基于规则的方法。

2026年4月27号 16:53

170

AI日报：小红书首次公布AI治理主张；荣耀YOYO率先接入DeepSeek-V4；灵光App率先将世界模型搬上移动端

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、小红书首次公布「AI治理主张」：抵制AI侵权、AI造假、AI仿冒等行为小红书首次公布「AI治理主张」，强调AI在创作中的积极作用，同时明确反对AI造假、侵权等不良行为，致力于维护社区的真实性与安全。8、OpenAI战略重心调整：编程模型Codex正式并入GPT-5.5架构OpenAI的战略重心调整，将Codex编程模型正式并入GPT-5.5架构，体现了其从专用插件式向内生全能式的转变，同时提升了模型的效率和性能。

2026年4月27号 16:13

OpenAI 战略重心调整：编程模型 Codex 正式并入 GPT-5.5 架构

OpenAI宣布终止独立编程模型Codex，将其核心能力整合进GPT-5.5主模型。这意味着GPT-5.3成为独立Codex的绝唱，标志着研发思路从“专用插件式”转向“内生全能式”，开发者将不再依赖专门编程分支。

2026年4月27号 16:09

250

携程商旅发布AI生态全景图:推出7大行业Agent并开放17项底层能力

携程商旅发布“AI生态”全景图，利用大模型技术重构企业差旅管理，覆盖出行、管理、采购及能力共享四大场景，并推出7个专属AI Agent，涵盖问答、预订、审批、风控等环节，标志着商旅行业从数字化向自动化、智能化Agent时代迈进。

2026年4月27号 14:33

240

腾讯推出具身多模态大模型 HY-Embodied-0.5-X，赋能机器人智能交互

腾讯 Robotics X 与混元团队联合开源HY-Embodied-0.5-X多模态大模型，专为机器人具身任务优化。该模型基于MoT-2B架构，强化“看懂、想清、做到”能力，在精细操作、空间推理、动作预测和风险判断上表现突出。系列包含MoT-2B和MoE-32B两个版本，旨在提升机器人在真实环境的智能交互水平。

2026年4月27号 13:54

250

腾讯 QClaw 迎来大升级：DeepSeek-V4-Pro 接入，AI 专家“开箱即用”

腾讯云Agent平台QClaw发布v0.2.14版本，这是迄今最大更新。升级包括接入Hermes框架，支持创建运行Hermes类型Agent，实现底层模型多元化，大幅降低AI使用门槛，用户可在单一应用内调度多种模型。

2026年4月27号 13:47

490

OpenAI CEO 奥尔特曼发布五大原则：致力于让 AGI 惠及全人类

OpenAI CEO萨姆·奥尔特曼提出AI发展五项核心原则，强调技术应惠及全人类。他认为AI的变革潜力或超蒸汽机与电力，但进步需避免权力集中，确保公平分配。

2026年4月27号 11:30

360

亚毫米级精准对位：小米开源 VLA 大模型后训练全流程

小米近日开源了视觉-语言-动作大模型Xiaomi-Robotics-0的真机后训练全流程，推动具身智能发展。团队仅用约20小时任务数据训练，就让机器人掌握精准收纳耳机等高难度操作，展示了快速学习复杂技能的能力。

2026年4月27号 10:59

240

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

GEO品牌全景分析

GEO品牌得分检测

GEO排名查询

GEO推广链接检测

GEO排名优化系统源码

GEO 排名优化服务

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

大模型API聚合平台

模型库

模型供应商

大模型排行榜

大模型选型对比

大模型费用计算器

大模型竞技场

模型个人电脑配置检测器

模型部署服务器配置计算器

“百模大战”家家第一,大模型“跑分”作弊何时休?

罗超频道

本文来自AIbase日报

相关AI新闻推荐

千问APP首发灰测HappyHorse 可一键做TVB港风短片

震惊好莱坞！你刷到的热门大片，背后竟是中国AI在“打工”

OpenAI 推出 Privacy Filter：全新 PII 脱敏模型开源上线

AI日报：小红书首次公布AI治理主张；荣耀YOYO率先接入DeepSeek-V4；灵光App率先将世界模型搬上移动端

OpenAI 战略重心调整：编程模型 Codex 正式并入 GPT-5.5 架构

携程商旅发布AI生态全景图:推出7大行业Agent并开放17项底层能力

​腾讯推出具身多模态大模型 HY-Embodied-0.5-X，赋能机器人智能交互

腾讯 QClaw 迎来大升级：DeepSeek-V4-Pro 接入，AI 专家“开箱即用”

​OpenAI CEO 奥尔特曼发布五大原则：致力于让 AGI 惠及全人类

亚毫米级精准对位：小米开源 VLA 大模型后训练全流程

相关AI新闻推荐

千问APP首发灰测HappyHorse 可一键做TVB港风短片

震惊好莱坞！你刷到的热门大片，背后竟是中国AI在“打工”

OpenAI 推出 Privacy Filter：全新 PII 脱敏模型开源上线

AI日报：小红书首次公布AI治理主张；荣耀YOYO率先接入DeepSeek-V4；灵光App率先将世界模型搬上移动端

OpenAI 战略重心调整：编程模型 Codex 正式并入 GPT-5.5 架构

携程商旅发布AI生态全景图:推出7大行业Agent并开放17项底层能力

​腾讯推出具身多模态大模型 HY-Embodied-0.5-X，赋能机器人智能交互

腾讯 QClaw 迎来大升级：DeepSeek-V4-Pro 接入，AI 专家“开箱即用”

​OpenAI CEO 奥尔特曼发布五大原则：致力于让 AGI 惠及全人类

亚毫米级精准对位：小米开源 VLA 大模型后训练全流程

腾讯推出具身多模态大模型 HY-Embodied-0.5-X，赋能机器人智能交互

OpenAI CEO 奥尔特曼发布五大原则：致力于让 AGI 惠及全人类

腾讯推出具身多模态大模型 HY-Embodied-0.5-X，赋能机器人智能交互

OpenAI CEO 奥尔特曼发布五大原则：致力于让 AGI 惠及全人类