Nemotron-Mini-4B-Instructは、NVIDIAが開発した小型言語モデルです。蒸留、枝刈り、量子化による最適化により、速度の向上とデバイス上での展開が容易になっています。これは、NVIDIAの大規模言語モデル圧縮技術を用いて、nvidia/Minitron-4B-BaseをNemotron-4 15Bから枝刈りと蒸留によって得られた、微調整済みのモデルです。この指示モデルは、ロールプレイング、検索強化型質問応答(RAG QA)、機能呼び出し向けに最適化されており、4096トークンのコンテキスト長をサポートし、商用利用可能です。