Nemotron-Mini-4B-Instruct

ロールプレイング、検索強化生成、機能呼び出しに適した小型言語モデル

一般製品生産性小型言語モデル蒸留

Nemotron-Mini-4B-Instructは、NVIDIAが開発した小型言語モデルです。蒸留、枝刈り、量子化による最適化により、速度の向上とデバイス上での展開が容易になっています。これは、NVIDIAの大規模言語モデル圧縮技術を用いて、nvidia/Minitron-4B-BaseをNemotron-4 15Bから枝刈りと蒸留によって得られた、微調整済みのモデルです。この指示モデルは、ロールプレイング、検索強化型質問応答（RAG QA）、機能呼び出し向けに最適化されており、4096トークンのコンテキスト長をサポートし、商用利用可能です。

Best AI Websites & Tools

Nemotron-Mini-4B-Instruct

Nemotron-Mini-4B-Instruct 最新のトラフィック状況

Nemotron-Mini-4B-Instruct 訪問数の傾向

Nemotron-Mini-4B-Instruct 訪問地理的分布

Nemotron-Mini-4B-Instruct トラフィックソース

Nemotron-Mini-4B-Instruct 代替品

Nemotron-Mini-4B-Instruct — ロールプレイング、検索強化生成、機能呼び出しに適した小型言語モデル

MiniRAG — 小型モデルでも、異種グラフ索引と軽量トポロジ拡張検索によって優れたRAG性能を実現する、シンプルな検索強化生成フレームワークです。

Hermes 3 - Llama-3.1 70B — Nous Research社が開発したHermesシリーズ最新の大規模言語モデル

Opine — OpineはAIネイティブのソーシャルメディアアプリで、ユーザーはキャラクターを作成し、動画を作成して共有できます。

ViDoRAG — ViDoRAGは、視覚ドキュメント検索を強化した生成のための動的イテレーティブ推論エージェントフレームワークです。

M2RAG — マルチモーダルコンテキストにおける検索強化生成のためのベンチマークテストコードリポジトリです。

DeepHermes-3-Llama-3-8B-Preview — DeepHermes 3は、推論と通常の応答モードをサポートする大規模言語モデルです。

Tifa-Deepsex-14b-CoT-GGUF-Q4 — Deepseek-R1-14Bをベースに最適化された、ロールプレイングと思考連鎖（CoT）を備えたモデルです。長文作成や対話に適しています。

DeepSeek-R1-Distill-Llama-8B — DeepSeek-R1-Distill-Llama-8Bは、テキスト生成と推論タスクに適した高性能なオープンソース言語モデルです。

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3 — Qwen2.5-32Bモデルをベースとした4ビット量子化バージョンです。高効率推論と低リソース環境での展開を目的として設計されています。

InternLM3 — InternLM3は、テキスト生成に特化したモデル群であり、様々なニーズに対応するため複数の最適化バージョンを提供しています。

voyage-3-large — 複数の分野で卓越した性能を発揮する、最新鋭の多言語汎用埋め込みモデルです。

1.58-bit FLUX — 1.58ビット量子化による高度なテキストから画像生成モデル

Llama-3-Patronus-Lynx-8B-v1.1-Instruct-Q8-GGUF — Llamaモデルベースの量子化バージョンで、対話と幻覚検出に使用されます。

FastVideo — 大規模ビデオ拡散モデルを高速化するオープンソースフレームワーク

Phi オープンモデル — Phi オープンモデルは、強力で低コスト、低遅延の小型言語モデルです。

Style Me — AIカメラでワンタッチでスタイリッシュな写真を生成

AIゲームマスター — AI駆動型ダンジョンRPGテキストアドベンチャーゲーム

Qwen2.5-Coder-32B-Instruct-GGUF — オープンソースのコード生成言語モデル

Friends & Fables — AI駆動のデスクトップ型テーブルトークRPG（TRPG）とワールドビルディングツール

量子化Llama — 効率的で軽量な量子化Llamaモデル。モバイルデバイスでの動作速度を向上させ、メモリ使用量を削減します。

SLM_Survey — 小型言語モデル調査、計測、および洞察

torchao — PyTorchネイティブの量子化とスパース性トレーニングおよび推論ライブラリ

Saylo AI — 無限の可能性を秘めたAIロールプレイングゲームを探索しましょう。

cog-flux — FLUXモデルのCog推論エンジン

DreamRP — ファンとキャラクターを通して直接的な交流を行い、没入型のストーリー体験を作り出しましょう。

オルテラ プレイラボ — 様々な役割を体験できるインタラクティブプラットフォームです。

Hello Literature — 文学巨著の登場人物と対話することで、読書体験を生き生きとさせましょう。

C4AI CommandR 08-2024 — 35億パラメーターの高性能生成モデル

ComfyUI-GGUF — GGUF量子化対応により、ComfyUIネイティブモデルのパフォーマンスを最適化します

オルテラプレイラボ — 様々な役割を体験できるインタラクティブプラットフォームです。