Nemotron-Mini-4B-Instruct

用于角色扮演、检索增强生成和功能调用的小型语言模型

普通产品生产力小型语言模型蒸馏
Nemotron-Mini-4B-Instruct 是 NVIDIA 开发的一款小型语言模型,通过蒸馏、剪枝和量化优化,以提高速度和便于在设备上部署。它是从 Nemotron-4 15B 通过 NVIDIA 的大型语言模型压缩技术剪枝和蒸馏得到的 nvidia/Minitron-4B-Base 的微调版本。此指令模型针对角色扮演、检索增强问答(RAG QA)和功能调用进行了优化,支持 4096 个令牌的上下文长度,已准备好用于商业用途。
打开网站

Nemotron-Mini-4B-Instruct 最新流量情况

月总访问量

20899836

跳出率

46.04%

平均页面访问数

5.2

平均访问时长

00:04:57

Nemotron-Mini-4B-Instruct 访问量趋势

Nemotron-Mini-4B-Instruct 访问地理位置分布

Nemotron-Mini-4B-Instruct 流量来源

Nemotron-Mini-4B-Instruct 替代品