英伟达开源新突破：新模型训练算力节省1.8倍！

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Aug 16, 2024

265

全球人工智能的领军企业英伟达（Nvidia）最近开源了两款新型大模型:Nemotron-4-Minitron-4B和Nemotron-4-Minitron-8B。这两个模型的开源，不仅是技术上的一次飞跃，更在AI领域掀起了一场效率革命。

传统的AI大模型训练需要消耗大量的数据和算力。然而，英伟达通过采用结构化剪枝和知识蒸馏两种高效的训练方法，显著降低了这一需求。具体来说，与从零开始训练相比，新模型所需的训练token数据减少了40倍，算力成本节省了1.8倍。这一成就的背后，是英伟达对现有模型Llama-3.18B的深度优化。

结构化剪枝是一种神经网络压缩技术，它通过去除不重要的权重来简化模型结构。不同于随机剪枝，结构化剪枝保留了权重矩阵的结构，通过移除整个神经元或注意力头，使得剪枝后的模型更适合在GPU、TPU等硬件上高效运行。

知识蒸馏是一种通过让学生模型模仿教师模型来提升性能的方法。在英伟达的实践中，通过基于logit的知识蒸馏，学生模型能够学习到教师模型的深层理解，即使在大幅减少训练数据的情况下，也能保持出色的性能。

经过结构化剪枝和知识蒸馏训练的Minitron-4B和Minitron-8B模型，在MMLU上的评分提升了16%，性能可与Mistral7B、Gemma7B和Llama-38B等知名模型媲美。这一成果证明了英伟达方法的有效性，同时也为AI大模型的训练和部署提供了新的可能性。

英伟达的这一开源举措，不仅展示了其在AI技术上的领导地位，也为AI社区带来了宝贵的资源。随着AI技术的不断进步，我们期待看到更多创新的方法，推动AI向更高效、更智能的方向发展。

模型地址：

https://huggingface.co/nvidia/Nemotron-4-Minitron-4B-Base

https://huggingface.co/nvidia/Nemotron-4-Minitron-8B-Base

英伟达 Nemotron-4 训练方法结构化剪枝

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

CoreWeave 率先推出英伟达最新 AI 芯片，助力云计算行业创新

近日，英伟达与 CoreWeave 宣布，英伟达最新的人工智能图形处理器 Blackwell Ultra 芯片已在 CoreWeave 实现商业部署。这一消息无疑为 AI 技术的云计算服务注入了新的活力。戴尔也表示，CoreWeave 已经收到基于英伟达 GB300NVL72AI 系统的定制设备，这标志着 CoreWeave 成为首家安装基于 Blackwell Ultra 系统的云服务提供商。图源备注：图片由AI生成，图片授权服务商MidjourneyBlackwell Ultra 是英伟达推出的最新芯片，预计将在今年剩余的时间内批量出货。CoreWeave 所安装的系统采用了先进的液冷技术，包含72个 B

2025年7月4号 10:08

490

Shortcut横空出世！AI Excel助手10倍速碾压人类冠军，自动化任务效率飙升

近日，一款名为Shortcut的AI Excel助手在社交媒体上引发热议，其通过自然语言处理（NLP）技术，让用户无需编写复杂公式或VBA代码，即可轻松完成Excel任务。AIbase编辑团队整理了社交媒体上的最新信息，为您深度解析Shortcut的强大功能及其对数据处理和财务建模领域的潜在影响。Shortcut:自然语言驱动的Excel革命Shortcut被誉为“超人级Excel代理”（Superhuman Excel Agent），能够通过简单的自然语言指令完成复杂的Excel任务。用户只需描述需求，例如“帮我计算总销售额”或“生成月度销售趋势图”，

2025年7月3号 17:58

3.3k

A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、字节跳动EX-4D震撼开源:单目视频秒变自由视角4D大片EX-4D是字节跳动PICO-MR团队推出的4D视频生成框架，能够从单目视频生成高质量、多视角的4D视频序列。该技术通过深度密闭网格（DW-Mesh）和轻量级适配架构，解决了传统视频生成技术在多视角生成中的挑战，并在性能指标上全面领先。【AiBase

2025年7月3号 16:27

2.8k

Claude Code再升级！Hooks功能解锁AI编程新境界，自动化更智能

随着人工智能技术在编程领域的深入应用，Anthropic推出的Claude Code凭借其强大的代码理解与自动化能力，已成为众多开发者的得力助手。就在昨日，Claude Code迎来了一次重要更新，新增了Hooks功能，为开发者提供了更精细的控制能力和更高效的开发体验。什么是Hooks功能?Hooks功能是Claude Code引入的一种用户自定义shell命令机制，允许开发者在Claude Code的代理循环（Agent Loop）的不同阶段自动执行特定操作。根据社交媒体反馈，这一功能的核心在于其确定性控制，确保关键任务(如代码格式化、测试

2025年7月3号 14:28

3.1k

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异，推出 OctoThinker

大型语言模型（LLM）通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展，如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型，展现出强大的推理能力。然而，这种成功在不同的基础模型系列中难以复制，尤其是在 Llama 系列上。这引发了一个核心问题:究竟是什么因素导致了不同基础模型在强化学习过程中表现不一致?强化学习在 Llama 模型上的扩展限制OpenAI 的 o1、o3和 DeepSeek 的 R1等模型在竞赛级数学问题上通过大规模强化学习取得了突破，推动了对千亿参数以下小

2025年7月3号 11:05

1.7k

字节EX-4D 技术实现单目视频4D化，解锁极端视角下高质量内容生成

由研究团队 tau-yihouxiang 开发的 EX-4D（Extreme Viewpoint4D Video Generation）技术，一项颠覆传统的视频生成创新，正在全球范围内引发广泛关注。这项技术旨在将单目视频转化为可控的4D 体验，尤其在极端摄像机角度下展现出卓越的性能。EX-4D 技术的核心在于其独特的“深度水密网格”构建方法。这种新颖的几何表示方式，能够有效建模可见和被遮挡区域，并在 -90° 至90° 的广泛角度范围内生成高质量视频。这一突破为游戏、电影制作、虚拟现实（VR）和增强现实(AR)等多个领域的应用奠定了基础。

2025年7月3号 10:05

200

字节跳动EX-4D震撼开源：单目视频秒变自由视角4D大片

字节跳动旗下PICO-MR团队正式开源了**EX-4D**，一款突破性的4D视频生成框架。这款工具能够从单一视角（单目）视频生成高质量、多视角的4D视频序列(3D空间+时间维度)，标志着视频生成技术迈向了新的里程碑。EX-4D不仅在技术指标上超越现有开源方法，还为沉浸式3D内容创作和“世界模型”构建提供了关键支持。以下是AIbase对这一前沿技术的深入解读。 **技术突破:从单目视频到自由视角**传统视频生成技术在多视角生成方面面临两大挑战:一是需要昂贵的多视角相机和数据集进行训练;二是难以

2025年7月3号 9:45

3.0k

OpenAI 暂停大规模使用谷歌 TPU 芯片，英伟达与 AMD 仍为核心供应商

OpenAI 最近宣布，尽管在初期阶段进行了测试，但不会大规模采用谷歌的 TPU 芯片。TPU（张量处理单元）是谷歌专为机器学习任务设计的定制化 ASIC 芯片，旨在加速神经网络的训练与推理。TPU 采用数据流驱动架构，能够实现高效的矩阵乘法流水线计算，从而减少内存访问延迟。图源备注：图片由AI生成，图片授权服务商MidjourneyOpenAI 表示将继续依赖英伟达的 GPU 和 AMD 的 AI 加速器来支持其模型的训练与推理。这是因为这两家公司的产品已经经过验证，并且 OpenAI 与它们之间已经建立了供应协议

2025年7月3号 8:58

1.1k

OpenAI 声明：Robinhood 推出的 “OpenAI 代币” 与我们无关

最近，加密交易平台 Robinhood 在欧洲推出了 OpenAI 和 SpaceX 的代币化股票，这一消息引发了广泛关注。然而，OpenAI 迅速对此进行澄清，表示这些 “OpenAI 代币” 并不代表 OpenAI 的股权，并且与 Robinhood 没有任何合作关系。OpenAI 通过社交媒体平台 X 发布了一则声明，明确指出:“这些‘OpenAI 代币’不是 OpenAI 的股权。我们没有与 Robinhood 合作，也没有参与其中。” 该公司进一步强调，任何对 OpenAI 股权的转让都需要经过他们的批准，而他们并未批准任何相关的转让，提醒用户在此投资项目中要保

2025年7月3号 8:57

700

OpenAI 启动高端企业 AI 咨询服务客户收费至少 1000 万美元

据 The Information 报道，OpenAI 正在加大其企业 AI 咨询业务的力度，收费标准至少为每位客户1000万美元。公司工程师直接与各组织合作，调整如 GPT-4o 等模型以适应其特定数据，并构建定制应用程序，包括聊天机器人等。这一举措使 OpenAI 与诸如 Palantir 和 Accenture 等知名企业展开直接竞争。图源备注:图片由AI生成，图片授权服务商MidjourneyOpenAI 提供的服务不仅限于模型定制，还包括数据标注服务。在这一过程中，专家会对 AI 生成的答案进行审核和修正。内部消息人士透露，OpenAI 正在考虑将部分

2025年7月2号 10:56

1.8k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图