打开语言模型“黑箱”！Google DeepMind 发布一套可视化工具Gemma Scope

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Aug 1, 2024

388

在人工智能的世界里，语言模型如同一个深不可测的黑箱，我们投入文字，它吐出意义。但在这个过程中，究竟发生了什么?Google DeepMind的最新研究——Gemma Scope，为我们揭开了这个黑箱的一角。

语言模型的激活通常被视为向量的稀疏、线性组合，但这些组合背后的真实意义却难以捉摸。为了解决这个问题，稀疏自编码器（SAEs）作为一种无监督学习方法，被寄予厚望。然而，这项技术仍在襁褓之中，训练成本高昂，研究进展缓慢。

Google DeepMind团队训练并发布了Gemma Scope，这是一套在Gemma2模型上训练的稀疏自编码器。它通过编码器和解码器对语言模型的激活进行分解和重构，以期揭示出那些有意义的特征。

Gemma Scope采用了一种创新的JumpReLU SAEs，它通过一个移位的Heaviside阶跃函数作为门控机制，控制激活，使模型的潜在特征数量得到有效控制。这种设计不仅优化了重建损失，还直接正则化了活跃的潜在特征数量。

在Gemma2模型的激活上，Gemma Scope经过了精心的训练。训练过程中，模型的激活向量被归一化，SAEs在不同的层和位置被训练，包括注意力头输出、MLP输出和后MLP残差流。

Gemma Scope的性能从多个角度进行了评估。实验结果显示，残差流SAEs的Delta损失通常更高，而序列长度对SAE性能有显著影响。此外，不同数据集子集的表现也不尽相同，Gemma Scope在DeepMind mathematics上表现最佳。

Gemma Scope的发布，为解决一系列开放问题提供了可能。它不仅可以帮助我们更深入地理解SAEs，还可以改进实际任务的性能，甚至对SAEs进行红队测试，以确定它们是否真正找到了模型中的“真实”概念。

随着Gemma Scope的应用，我们有望在AI的可解释性和安全性方面迈出重要一步。它将帮助我们更好地理解语言模型的内部工作机制，提高模型的透明度和可靠性。

论文地址：https://storage.googleapis.com/gemma-scope/gemma-scope-report.pdf

在线体验：https://www.neuronpedia.org/gemma-scope#main

人工智能语言模型 GoogleDeepMind GemmaScope

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Shortcut横空出世！AI Excel助手10倍速碾压人类冠军，自动化任务效率飙升

近日，一款名为Shortcut的AI Excel助手在社交媒体上引发热议，其通过自然语言处理（NLP）技术，让用户无需编写复杂公式或VBA代码，即可轻松完成Excel任务。AIbase编辑团队整理了社交媒体上的最新信息，为您深度解析Shortcut的强大功能及其对数据处理和财务建模领域的潜在影响。Shortcut:自然语言驱动的Excel革命Shortcut被誉为“超人级Excel代理”（Superhuman Excel Agent），能够通过简单的自然语言指令完成复杂的Excel任务。用户只需描述需求，例如“帮我计算总销售额”或“生成月度销售趋势图”，

2025年7月3号 17:58

240

2025 全球 AI 人才榜单：华人专家和新兴力量的崛起

在2025全球数字经济大会上，首次发布的全球人工智能（AI）人才榜单引发广泛关注。该榜单基于近十年来近10万篇文献的深度分析，列出了全球 AI 领域的 Top100人才，其中华人科学家占据了重要席位，显示出他们在这一领域的卓越贡献与影响力。榜单的发布再次印证了业内人士的观点:“得华人科学家者得 AI 天下”。其中，何恺明作为深度学习的先驱之一，被誉为 “CV 界的诺奖级工作” 之父。他的残差学习（Residual Learning）概念突破了神经网络长期以来的 “梯度消失” 难题，极大推动了深

2025年7月3号 16:27

840

A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、字节跳动EX-4D震撼开源:单目视频秒变自由视角4D大片EX-4D是字节跳动PICO-MR团队推出的4D视频生成框架，能够从单目视频生成高质量、多视角的4D视频序列。该技术通过深度密闭网格（DW-Mesh）和轻量级适配架构，解决了传统视频生成技术在多视角生成中的挑战，并在性能指标上全面领先。【AiBase

2025年7月3号 16:27

520

字节跳动开源新模型VINCIE-3B：3亿参数，支持上下文连续图像编辑

字节跳动宣布开源VINCIE-3B，一款支持上下文连续图像编辑的3亿参数模型，基于其内部MM-DiT架构开发。这款模型突破了传统图像编辑的局限，首次实现从单一视频数据中学习上下文感知的图像编辑能力，无需依赖复杂的分割或修复模型生成训练数据。VINCIE-3B的发布为创意设计、影视后期及内容生成领域带来了全新的可能性。AIbase深入剖析其技术亮点、应用场景及行业影响。技术突破:从视频到上下文编辑传统图像编辑模型通常依赖任务特定的数据管道，需通过专家模型（如分割、修复）生成

2025年7月3号 14:30

1.8k

Claude Code再升级！Hooks功能解锁AI编程新境界，自动化更智能

随着人工智能技术在编程领域的深入应用，Anthropic推出的Claude Code凭借其强大的代码理解与自动化能力，已成为众多开发者的得力助手。就在昨日，Claude Code迎来了一次重要更新，新增了Hooks功能，为开发者提供了更精细的控制能力和更高效的开发体验。什么是Hooks功能?Hooks功能是Claude Code引入的一种用户自定义shell命令机制，允许开发者在Claude Code的代理循环（Agent Loop）的不同阶段自动执行特定操作。根据社交媒体反馈，这一功能的核心在于其确定性控制，确保关键任务(如代码格式化、测试

2025年7月3号 14:28

1.5k

百度文心联手小米应用商店，智能体正式"登陆"传统应用市场

百度文心智能体平台宣布与小米应用商店达成深度合作，双方联手打造行业首个智能体与应用市场跨端分发模式，正式上线"AI智能体专区"，实现智能体与传统应用市场的首次深度融合。根据合作协议，小米应用商店将从即日起陆续向用户开放AI智能体分发功能，在应用市场首页专门增设AI智能体专区。此举标志着智能体服务正式进入主流应用分发渠道，为用户提供更便捷的AI服务获取途径。在技术实现层面，文心智能体平台的开发者现可通过一键部署功能，将自己开发的智能体直接发布至小

2025年7月3号 14:19

830

毕马威报告:中国医疗大模型数量领跑占全球七成

毕马威中国近日发布的《首届健康科技50》报告揭示，中国在医疗大模型领域已占据全球主导地位。报告指出，在全球已发布的医疗大模型中，中国发布数量占比超过70%，远超其他国家和地区。从模型类别来看，大语言模型（LLM）数量最多，占比接近65%。此外，报告还强调了中国智能医疗器械市场的强劲增长势头。预计到2025年，中国智能医疗器械市场规模将达到242.3亿元，并在2026年至2027年间有望继续保持较高速度增长。这一系列数据表明，中国在健康科技，特别是医疗人工智能和智能医疗

2025年7月3号 14:13

600

Bilibili开源动漫视频生成模型AniSora V3版，一键生成多种风格动漫视频镜头

Bilibili（B站）宣布其开源动漫视频生成模型AniSora迎来重大更新，正式发布AniSora V3。作为Index-AniSora项目的一部分，V3版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性，为动漫、漫画及VTuber内容创作者提供了更强大的工具。AIbase深入解读AniSora V3的技术突破、应用场景及行业影响。技术升级:更高质量与精准控制AniSora V3基于Bilibili此前开源的CogVideoX-5B和Wan2.1-14B模型，结合强化学习与人类反馈（RLHF）框架，显著提升了生成视频的视觉质量和动作一致性。其支持一键

2025年7月3号 11:59

1.9k

Perplexity 推出每月200美元“Max”订阅服务，解锁高级 AI 模型与独家功能

Perplexity 现已推出每月200美元的 AI 订阅服务 Perplexity Max。这项新订阅旨在为用户提供一系列增强功能，包括访问“顶级高级 AI 模型”以及抢先体验即将推出的 Comet 浏览器等独家福利。Perplexity Max 订阅服务目前可在网页版和 iOS 应用上使用。Perplexity AI 是一家由前 Google AI 专家创办的初创公司，于2022年成立，并在短时间内凭借其独特的对话式搜索引擎获得了广泛关注。不同于传统的搜索引擎仅提供链接列表，Perplexity AI 能够直接为用户提供带有引用来源的摘要答案，使其在信息获取方面更加

2025年7月3号 11:51

920

小米应用商店上线AI智能体专区首批合作百度文心智能体平台

自7月起，小米应用商店将分阶段向用户开放AI智能体分发服务。用户打开小米应用商店APP后，点击底部新增的【智能体】入口，即可直达专区浏览并体验各类实用有趣的AI智能体产品。同时，用户还可通过搜索功能快速定位所需服务，整个过程无需下载安装，真正实现“即开即用”的便捷体验。这一创新模式不仅降低了用户获取AI服务的门槛，更通过场景化推荐提升了服务触达效率。值得关注的是，小米应用商店此次与百度文心智能体平台达成深度合作，首批引入其优质智能体资源。开发者在百度文心平台完成智能体开发后，仅需选择“

2025年7月3号 11:43

1.3k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图