OpenCompass 2.0 大規模言語モデルランキング

大規模言語モデルのパフォーマンスをリアルタイムで評価するランキングです。

一般製品生産性評価ランキング

OpenCompass 2.0は、大規模言語モデルのパフォーマンス評価に特化したプラットフォームです。複数のクローズドソースデータセットを用いて多角的な評価を行い、モデル全体の平均スコアと専門スキルスコアを提供します。リアルタイムでランキングを更新することで、開発者や研究者は言語、知識、推論、数学、プログラミングなどの分野における様々なモデルのパフォーマンスを把握できます。

Best AI Websites & Tools

OpenCompass 2.0 大規模言語モデルランキング

OpenCompass 2.0 大規模言語モデルランキング 最新のトラフィック状況

OpenCompass 2.0 大規模言語モデルランキング 訪問数の傾向

OpenCompass 2.0 大規模言語モデルランキング 訪問地理的分布

OpenCompass 2.0 大規模言語モデルランキング トラフィックソース

OpenCompass 2.0 大規模言語モデルランキング 代替品

OpenCompass 2.0 大規模言語モデルランキング — 大規模言語モデルのパフォーマンスをリアルタイムで評価するランキングです。

RULER — 長文言語モデルの妥当性を評価するためのベンチマーク

Inception Labs — Inception Labsは、次世代の拡散型大規模言語モデルを発表し、極めて高速で効率的で高品質な言語生成能力を提供します。

OpenManus — OpenManusは、招待コードなしで使用できるオープンソースのインテリジェントエージェントプロジェクトです。

Instella — Instellaは、AMDが開発した高性能なオープンソース言語モデルであり、オープンソース言語モデルの発展を加速するために設計されています。

GPT-4.5 — OpenAIが発表した最新の言語モデルGPT-4.5は、教師なし学習能力の向上に重点を置き、より自然なインタラクション体験を提供します。

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Liteは、長文処理と多様なアプリケーションシナリオ向けに最適化された、高効率な言語モデルです。

Phi-4-mini-instruct — Phi-4-mini-instructは、高品質な推論集約型データに特化した軽量のオープンソース言語モデルです。

DeepSeek 日本語版 — DeepSeekは、論理推論、数学、プログラミングタスクに秀でた高度なAI言語モデルです。無料で利用できます。

AlphaMaze-v0.2-1.5B — 大規模言語モデルの視覚推論能力を向上させるための、テキスト迷路解決タスクを用いた革新的な手法

AlphaMaze — AlphaMazeは、視覚推論タスクに特化したデコーダー言語モデルであり、従来の言語モデルが視覚タスクで抱える課題を解決することを目指しています。

Smithery — Model Context Protocolサーバーを使用して、言語モデルの機能を拡張します。

Moonlight-16B-A3B — Moonlight-16B-A3Bは、Muon最適化器を用いてトレーニングされた160億パラメータの混合専門家モデルであり、効率的な言語生成を目的としています。

DeepHermes-3-Llama-3-8B-Preview — DeepHermes 3は、推論と通常の応答モードをサポートする大規模言語モデルです。

Lora — Loraは、iOSとAndroidに対応したモバイルデバイス向けに最適化されたローカル言語モデルです。

PaliGemma 2 mix — PaliGemma 2 mixは、多様なタスクと分野に適用可能な多機能ビジュアル言語モデルです。

Mistral Saba — Mistral Sabaは、中東および南アジア地域向けにカスタマイズされた地域言語モデルです。

OLMoEアプリ — Ai2 OLMoEは、iOSデバイスで動作するオープンソースの言語モデルアプリです。

Podscript — ポッドキャストやその他の音声ファイルの文字起こしテキストを生成するためのツールです。複数の言語モデルと音声認識APIに対応しています。

Xwen-Chat — Xwen-Chatは、日本語対話に特化した大規模言語モデルの集合体であり、複数バージョンのモデルと自然言語生成サービスを提供します。

LLMコードネーム — LLMを活用した、創造的なネーミングツールです。ユーザーはこれを使って、簡単にユニークな名前を生成できます。

Deeptrain — 言語モデルとAIエージェントにビデオ処理サービスを提供し、様々なビデオソースに対応しています。

Exa & Deepseek チャットアプリ — ExaのAPIを用いたウェブ検索と、Deepseek R1による推論を組み合わせた、オープンソースのチャットアプリケーションです。

DeepSeek-R1-Distill-Llama-8B — DeepSeek-R1-Distill-Llama-8Bは、テキスト生成と推論タスクに適した高性能なオープンソース言語モデルです。

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3 — Qwen2.5-32Bモデルをベースとした4ビット量子化バージョンです。高効率推論と低リソース環境での展開を目的として設計されています。

ReaderLM v2 — ReaderLM v2は、HTMLをMarkdownとJSONに変換するための、最先端の小型言語モデルです。

MiniMax-Text-01 — MiniMax-Text-01は、総パラメータ数4,560億、最大400万トークンのコンテキストを処理可能な強力な言語モデルです。

MiniMax-01 — 4,560億パラメーターを持つ強力な言語モデルで、最大400万トークンのコンテキストを処理可能です。

fullmoon — 10億パラメーターをポケットに。プライベートなローカル大型言語モデルとチャットできます。

MiniCPM-o-2_6 — MiniCPM-o 2.6は、視覚、音声、マルチモーダルライブストリーミングに適した強力なマルチモーダル大規模言語モデルです。

OpenCompass 2.0 大規模言語モデルランキング最新のトラフィック状況

OpenCompass 2.0 大規模言語モデルランキング訪問数の傾向

OpenCompass 2.0 大規模言語モデルランキング訪問地理的分布

OpenCompass 2.0 大規模言語モデルランキングトラフィックソース

OpenCompass 2.0 大規模言語モデルランキング代替品