MInference 1.0

長文脈大型言語モデルのプリフィル処理を高速化します。

一般製品プログラミング自然言語処理機械学習

MInference 1.0 は、長シーケンス処理のプリフィル段階を高速化することを目的とした疎計算手法です。長文脈注意行列における3つの独自の模式を識別することにより、長文脈大型言語モデル（LLM）に対する動的疎注意機構を実現し、1Mトークンのプリフィル段階を高速化しつつ、LLMの能力、特に検索能力を維持します。

Best AI Websites & Tools

MInference 1.0

MInference 1.0 最新のトラフィック状況

MInference 1.0 訪問数の傾向

MInference 1.0 訪問地理的分布

MInference 1.0 トラフィックソース

MInference 1.0 代替品

MInference 1.0 — 長文脈大型言語モデルのプリフィル処理を高速化します。

olmOCR — olmOCRは、LLMデータセットのトレーニングに使用するためにPDFを線形化するツールキットです。

Finbar — 世界中の基礎金融データを迅速にモデルに統合し、現代の金融アナリストの効率的な業務を支援します。

検出前の模倣 (Imitate Before Detect) — 機械改変テキストの検出精度向上のため、機械の文体を模倣する高度な手法です。

Project G-Assist — NVIDIAのAIアシスタント。GeForce RTX AI搭載PCユーザー向けに、最適化と制御機能を提供します。

Sonus-1 — Sonus-1：次世代大規模言語モデル（LLM）の幕開け

Text-to-CAD UI — 自然言語プロンプトからB-Rep CADファイルとメッシュを作成します。

InternVL2_5-8B-MPO — 優れた総合性能を備えたマルチモーダル大規模言語モデルです。

Llama-3.1-70B-Instruct-AWQ-INT4 — 700億パラメーターのテキスト生成モデル

ModernBERT — ModernBERTは、卓越した性能を誇る次世代エンコーダーモデルです。

Smolagents — 高性能スマートエージェント構築のための軽量ライブラリ

Llama-lynx-70b-4bitAWQ — 70億パラメーターのテキスト生成モデル

Gemini 2.0 Flash Experimental — Google DeepMind開発の高性能AIモデル

Q-RWKV-6 32B Instruct プレビュー — 複数の英語ベンチマークテストで最高記録を更新した、最も強力なRWKVモデルの変種です。

CosyVoice音声生成大規模モデル2.0-0.5B — 効率的で多言語対応の音声合成モデル

tulu-3-sft-olmo-2-mixture — 大規模多言語テキストデータセット

OLMo-2-1124-7B-RM — テキスト生成と分類に使用される大規模言語モデル

ChatGPT Pro — 最先端AIモデルへの大規模アクセスソリューション

PaliGemma 2 — PaliGemma 2は、調整が容易な高性能なビジョン言語モデルです。

OLMo 2 1124 7B Preference Mixture — 選好混合研究に使用される大規模テキストデータセット

OLMo-2-1124-7B-SFT — 高性能英語テキスト生成モデル

OLMo-2-1124-7B-DPO — 多様なタスクに対応可能な高度なテキスト生成モデルです。

OLMo-2-1124-13B-DPO — 多様なタスクに対応可能な高性能英語言語モデル

ProactiveAgent — 大規模言語モデルに基づくプロアクティブなエージェント。ユーザーのニーズを予測し、能動的に支援します。

OpenScholar — 科学文献合成のための検索拡張型言語モデル

dolmino-mix-1124 — OLMo2の第2段階トレーニング用、高品質データセット。

OLMo-2-1124-13B-Instruct — テキスト生成と対話に長けた、最適化された大規模言語モデルです。

OLMo-2-1124-7B-Instruct — 高性能英語対話生成モデル

Skywork-o1-Open-PRM-Qwen-2.5-7B — 高性能AIモデル。推論タスク能力を向上させます。

OLMo 2 — 最先端、完全にオープンな言語モデル