NVIDIA研究人员推Flextron框架：支持灵活AI模型部署无需额外微调

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jul 18, 2024

223

在人工智能领域，大型语言模型（LLMs）如GPT-3和Llama-2已经取得了显著进展，能够准确理解和生成人类语言。然而，这些模型庞大的参数量使得它们在训练和部署过程中需要大量的计算资源，这对资源有限的环境构成了挑战。

论文入口：https://arxiv.org/html/2406.10260v1

传统上，为了在不同的计算资源限制下实现效率和准确性的平衡，研究人员需要训练多个不同版本的模型。例如，Llama-2模型系列包括70亿、13亿和7亿参数的不同变体。然而，这种方法需要大量的数据和计算资源，效率并不高。

为了解决这一问题，NVIDIA和德克萨斯大学奥斯汀分校的研究人员推出了Flextron框架。Flextron是一种新颖的灵活模型架构和后训练优化框架，支持在不需要额外微调的情况下适应性地部署模型，从而解决了传统方法的低效问题。

Flextron通过样本高效训练方法和先进的路由算法将预训练的LLM转化为弹性模型。这种结构采用嵌套弹性设计，允许在推理过程中动态调整以满足特定的延迟和准确性目标。这种适应性使得在各种部署场景中使用单一预训练模型成为可能，显著减少了对多个模型变体的需求。

Flextron的性能评估显示，与多个端到端训练模型和其他最先进的弹性网络相比，它在效率和准确性上表现出色。例如，Flextron在ARC-easy、LAMBADA、PIQA、WinoGrande、MMLU和HellaSwag等多个基准测试中均表现出色，仅使用了原始预训练中7.63%的训练标记，从而节省了大量的计算资源和时间。

Flextron框架还包括弹性多层感知器（MLP）和弹性多头注意力(MHA)层，进一步增强了其适应性。弹性MHA层通过根据输入数据选择注意力头的子集，有效利用可用内存和处理能力，特别适合计算资源有限的场景。

划重点:
🌐 Flextron框架支持灵活AI模型部署，无需额外微调。
🚀 通过样本高效训练和先进路由算法，提高了模型效率和准确性。
💡 弹性多头注意力层优化了资源利用，特别适合计算资源有限的环境。
这篇报道希望能为高中生读者通俗易懂地介绍Flextron框架的重要性和创新性。

AI头条

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

国内团队创造历史！“人类最后的考试” 首次得分突破30分，AI竞争再升级！

上海交大与深势科技团队开发的X-Master智能体系统在超高难度AI测试"HLE"中创下32.1分新纪录，首次突破30分大关。该系统采用工具增强型推理和多智能体协作架构，能模拟人类研究思维，通过代码执行和反馈循环优化决策。其分散-堆叠式工作流让多个智能体并行解题、评估改进，最终整合最优方案，尤其在生物医学领域表现突出。该成果已开源，推动AI领域发展。

2025年7月9号 17:55

180

AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

【AI日报速览】阿里开源ThinkSound音频生成模型，支持链式推理实现高保真空间音频；谷歌Veo3升级，单图即可生成专业运镜视频；Hugging Face发布30亿参数SmolLM3模型，支持双模式推理；阿里WebSailor智能体展现强大检索能力；Moonvalley推出1080P无版权风险视频模型；Vidu Q1支持7图融合生成一致性视频；苹果研发AI客服助手优化用户体验；飞书发布多款企业AI产品及成熟度模型；微软等科技巨头联合成立AI教育学院，投入2300万美元培训教师。

2025年7月9号 16:24

340

香港首个AI问答系统上线，带你畅游智能时代

香港维纳智能科技发布首个免费大模型协同问答系统"QueWi"及两款旗舰应用，突破AI发展瓶颈。公司开发了SYNC、ToM等核心技术，解决行业交互数据短缺问题。测试显示其系统性能超越国际主流AI模型，时事溯源能力达94%，本地名词识别精确度超93%。这一创新将推动香港及全球AI技术应用，助力实现"智能生活"愿景。

2025年7月9号 16:02

560

Mistral寻求10亿美元融资，剑指欧洲AI王座！

法国AI公司Mistral寻求10亿美元股权融资，估值达65.1亿美元。该公司以开源大语言模型和聊天机器人Le Chat闻名，已累计融资11.9亿美元。此次融资将用于研发和市场拓展，同时与MGX基金、英伟达合作建设欧洲最大AI数据中心园区，支持法国AI主权计划。Mistral的发展将提升欧洲在全球AI竞争中的地位。

2025年7月9号 15:58

290

飞书发布多款 AI 新产品，助力企业打造智能化办公新生态！

飞书在7月9日发布会上推出多款AI产品，包括知识问答、AI会议、Aily和飞书妙搭等，助力企业智能化转型。其王牌产品多维表格完成重大更新，可替代小型业务系统处理销售、客服等业务。飞书发布首个AI应用成熟度模型，将AI应用分为四个等级，其中知识问答工具达M3级别，能快速回答员工提问；智能会议纪要达M4级别，可实时总结会议并生成待办事项。多维表格新增应用模式，支持1000万行数据，加载速度显著提升。此外，飞书还推出企业开发套件和Aily开发平台，提升客服效率，飞书妙搭则加速产品原型开发。这些创新产品为企业带来智能化体验，推动行业发展。

2025年7月9号 15:18

980

Hugging Face重磅开源SmolLM3：3B参数小模型媲美4B巨头，128K上下文引领高效AI新风潮！

Hugging Face推出3B参数开源模型SmolLM3，性能媲美4B参数模型。该模型采用GQA和NoPE技术优化，支持128K长上下文和六种语言处理，在多项基准测试中表现优异。创新性地提供"思考"与"非思考"双推理模式，复杂任务性能提升显著。完全开源训练数据与代码，适合边缘设备部署，为教育、客服等场景提供高性价比解决方案。其开源特性将推动AI生态发展，展现小模型的巨大潜力。

2025年7月9号 14:30

600

Vidu Q1震撼升级:参考转视频支持最多七张图像，AI视频生成再创新高

Vidu Q1模型推出"参考转视频"新功能，支持上传7张参考图像生成1080p高质量视频。该功能通过语义融合技术实现多元素视觉一致性，解决传统AI视频生成中的场景断裂问题。用户可组合人物、场景等图像，配合文本提示生成复杂叙事视频。模型还具备多主体一致性技术，确保角色、物体等元素在视频中保持特征稳定，支持多角度镜头切换和动态过渡，显著降低复杂场景制作门槛，为动画、广告等专业创作提供影视级体验。

2025年7月9号 14:12

860

飞书重磅发布多款AI新品，打造企业级“豆包”

飞书发布AI产品矩阵及行业首个AI应用成熟度模型，推动企业智能化转型。新产品包括知识问答（M3级）、智能会议纪要（M4级）等，其中多维表格实现千万行数据处理和AI工作流突破。飞书开发套件推出Aily平台和"飞书妙搭"工具，支持企业快速构建AI应用。CEO谢欣强调AI产品应注重实际效果，新模型将AI应用分为四个成熟度等级，帮助企业合理评估技术应用水平。多维表格性能提升10倍，加载速度达行业领先水平，并新增BI分析功能。

2025年7月9号 14:11

1.1k

苹果研发类似 ChatGPT AI 客服助手，提升用户支持体验

苹果正开发AI"支持助手"提升客服体验，用户可通过聊天功能获取问题解决方案。该功能已在Apple Support应用代码中发现，允许用户输入问题获得AI生成答案，减少等待时间。支持助手基于生成模型提供产品相关解答，但苹果提醒可能存在不准确信息。用户可上传图片/文档辅助咨询，并保留转接人工客服选项。该功能可能采用ChatGPT技术，目前正在内部测试中，具体上线时间未定。

2025年7月9号 11:49

630

Moonvalley发布Marey Realism v1.5：原生1080P AI视频模型，零版权风险引领行业新风向！

Moonvalley发布全新AI视频生成模型Marey Realism v1.5，具备三大核心优势：原生1080P高清画质，基于授权训练数据确保零版权风险，以及精准解读复杂提示的创作能力。该模型支持文本/图像转视频，能生成电影级运动光影效果，未来还将推出姿势传递功能。这一突破性产品为影视制作、广告创意等领域提供了安全高效的AI创作工具，推动行业技术升级。

2025年7月9号 11:17

1.2k

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

NVIDIA研究人员推Flextron框架：支持灵活AI模型部署无需额外微调

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

国内团队创造历史！“人类最后的考试” 首次得分突破30分，AI竞争再升级！

AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

香港首个AI问答系统上线，带你畅游智能时代

Mistral寻求10亿美元融资，剑指欧洲AI王座！

飞书发布多款 AI 新产品，助力企业打造智能化办公新生态！

Hugging Face重磅开源SmolLM3：3B参数小模型媲美4B巨头，128K上下文引领高效AI新风潮！

Vidu Q1震撼升级:参考转视频支持最多七张图像，AI视频生成再创新高

飞书重磅发布多款AI新品，打造企业级“豆包”

苹果研发类似 ChatGPT AI 客服助手，提升用户支持体验

Moonvalley发布Marey Realism v1.5：原生1080P AI视频模型，零版权风险引领行业新风向！

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

NVIDIA研究人员推Flextron框架：支持灵活AI模型部署 无需额外微调

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

国内团队创造历史！“人类最后的考试” 首次得分突破30分，AI竞争再升级！

AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

香港首个AI问答系统上线，带你畅游智能时代

Mistral寻求10亿美元融资，剑指欧洲AI王座！

飞书发布多款 AI 新产品，助力企业打造智能化办公新生态！

Hugging Face重磅开源SmolLM3：3B参数小模型媲美4B巨头，128K上下文引领高效AI新风潮！

Vidu Q1震撼升级:参考转视频支持最多七张图像，AI视频生成再创新高

飞书重磅发布多款AI新品，打造企业级“豆包”

苹果研发类似 ChatGPT AI 客服助手，提升用户支持体验

Moonvalley发布Marey Realism v1.5：原生1080P AI视频模型，零版权风险引领行业新风向！

NVIDIA研究人员推Flextron框架：支持灵活AI模型部署无需额外微调