「深呼吸」让大模型表现更佳!谷歌DeepMind利用大语言模型生成Prompt,还是AI更懂AI

新智元
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌近期宣布,2022年该公司成功封停了3920万个广告主账号,数量是2023年的三倍。这一成绩主要归功于谷歌在广告审核中应用的先进人工智能技术。通过大语言模型的辅助,谷歌能够在广告投放前识别出商业冒充、非法支付信息等违规行为,从而快速暂停大部分广告账户。谷歌广告安全总经理亚历克斯・罗德里格兹在一次虚拟媒体会议上指出,这些 AI 模型在改进广告安全方面发挥了重要作用,尽管如此,整个过程仍有人工审核的参与。他透露,谷歌成立了一个由100多名专家组成的团队,成
微信于2025年4月16日正式推出元宝AI好友功能,允许用户将腾讯自研的AI助手元宝添加为微信联系人,直接在聊天窗口进行交互。这一功能的发布不仅增强了微信作为超级应用的粘性,也对其他AI聊天服务和小程序构成显著竞争压力。以下是AIbase对元宝AI好友功能的深度解析,探讨其技术亮点、用户体验及对行业的潜在影响。元宝AI好友上线:无缝融入微信生态元宝是腾讯基于其混元(Hunyuan)大语言模型开发的AI助手,此前通过微信小程序或独立应用提供服务。AIbase了解到,新推出的元宝AI好友
备受瞩目的国内人工智能企业智谱华章(以下简称“智谱”)近日正式宣布,开源其新一代 GLM 系列大语言模型。此次开源力度空前,不仅包含 32B 和9B 两种参数规模的模型,更涵盖了 基座模型、推理模型以及代表未来探索方向的沉思模型。所有开源模型均遵循 宽松的 MIT 许可协议,为开发者提供了极大的自由度和商业应用的可能性。与此同时,该系列模型已通过智谱全新平台 Z.ai 免费开放体验,并同步上线 智谱 MaaS 平台 (bigmodel.cn)。开源赋能:技术普惠与创新加速本次智谱开源的 GLM 模
智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。
在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题时,如何准确评估模型每一步的回答质量,依然是一个亟待解决的难题。为此,清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM),为过程监督推理提供了创新解决方案。传统的过程奖励模型(PRM)虽然能够验证推理步骤的正确性,但由于采用了标量评分机制,难以捕捉深层次的逻辑错误。此外,PRM 的判别式
近日,来自卡内基梅隆大学、斯坦福大学、哈佛大学和普林斯顿大学的研究人员揭示了一个关于大语言模型(LLMs)训练的新发现:并不是预训练的数据越多,模型的表现就越好。相反,他们指出,过度的预训练可能会导致模型性能下降,出现一种被称为 “灾难性过度训练” 的现象。在一项研究中,研究者们对 OLMo-1B 模型进行了比较,分别对其进行了2.3万亿和3万亿个标记的训练。出乎意料的是,虽然第二个模型接受了更多的数据训练,但其在一些基准测试(例如 AlpacaEval 和 ARC)的表现却下
近日,北京大学定量生物学中心的钱珑团队成功研发出全球首个专门用于功能基因挖掘的大语言模型 SYMPLEX。这一创新的模型能够从海量的生物文献中高效筛选出具有特定功能的关键基因,推动生物科技的发展。SYMPLEX 的问世,标志着基因挖掘技术进入了一个全新的阶段。团队利用这一模型,进行 mRNA 加帽酶基因的挖掘,并取得了显著的成果:新发现的加帽酶活性远超目前用于 mRNA 疫苗生产的商业化酶。这一成果不仅展示了大语言模型在生物制造领域的巨大潜力,也为未来的疫苗生产提供了
随着人工智能技术的飞速发展,模型上下文协议(Model Context Protocol,MCP)生态正在成为连接大语言模型(LLM)与外部工具的桥梁,赋予AI前所未有的操作能力。MCP作为由Anthropic于2024年11月推出的开源协议,旨在标准化LLM与外部数据源和工具的交互方式。开发者们称其为“AI的USB-C接口”。通过MCP,LLM可以轻松调用网页搜索、文件操作甚至3D建模软件等工具,突破传统模型的局限。核心功能:多场景赋能智能代理MCP生态通过mcp-use提供了多项强大功能,显著提升了LLM的实用性与灵活性:广泛的模型兼
字节跳动加入了快速发展的AI推理模型竞争,推出了专注于科学、技术、数学和工程(STEM)领域的新型大语言模型Seed-Thinking-v1.5。这款采用混合专家(MoE)架构的模型在多项基准测试中表现优异,甚至在某些指标上超越了行业巨头的产品。推理AI的演进历程推理AI竞赛始于2024年9月OpenAI的o1模型发布,而后在2025年1月DeepSeek R1的推出后真正加速。如今,主要AI企业都在竞相开发能够执行"思路链"推理的模型,以提供更全面、更合理的回答。Seed-Thinking-v1.5采用了流行的混合专家(MoE)架构,类似于Me
在人工智能领域不断创新的谷歌,近日宣布了一项激动人心的计划。谷歌 DeepMind 的首席执行官 Demis Hassabis 在播客节目 Possible 中透露,公司将把其 Gemini AI 模型与 Veo 视频生成模型进行整合。这一举措旨在提升 Gemini 对物理世界的理解能力,助力开发出一个真正能够在现实生活中为用户提供帮助的通用数字助手。Hassabis 指出,从一开始,Gemini 模型就被设计为一个多模态系统,能够处理多种类型的数据和信息。他表示:“我们的愿景是构建一个能够整合各种媒体形式的助手,这样它才能更好地