Nemotron-Mini-4B-Instruct
ロールプレイング、検索強化生成、機能呼び出しに適した小型言語モデル
一般製品生産性小型言語モデル蒸留
Nemotron-Mini-4B-Instructは、NVIDIAが開発した小型言語モデルです。蒸留、枝刈り、量子化による最適化により、速度の向上とデバイス上での展開が容易になっています。これは、NVIDIAの大規模言語モデル圧縮技術を用いて、nvidia/Minitron-4B-BaseをNemotron-4 15Bから枝刈りと蒸留によって得られた、微調整済みのモデルです。この指示モデルは、ロールプレイング、検索強化型質問応答(RAG QA)、機能呼び出し向けに最適化されており、4096トークンのコンテキスト長をサポートし、商用利用可能です。
Nemotron-Mini-4B-Instruct 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44