DCLM-7B

7億パラメーターの言語モデル。データ整理技術の有効性を示しています。

プレミアム新製品プログラミング言語モデルTransformer

DCLM-Baseline-7Bは、DataComp for Language Models (DCLM)チームによって開発された、7億パラメーターの言語モデルです。主に英語を使用します。このモデルは、体系的なデータ整理技術によって言語モデルの性能向上を目指しています。モデルの訓練にはPyTorchとOpenLMフレームワークを使用し、最適化アルゴリズムはAdamW、学習率は2e-3、重み減衰は0.05、バッチサイズは2048シーケンス、シーケンス長は2048トークン、総訓練トークン数は2.5Tに達しました。モデル訓練にはH100 GPUを使用しました。

Best AI Websites & Tools

DCLM-7B

DCLM-7B 最新のトラフィック状況

DCLM-7B 訪問数の傾向

DCLM-7B 訪問地理的分布

DCLM-7B トラフィックソース

DCLM-7B 代替品

DCLM-7B — 7億パラメーターの言語モデル。データ整理技術の有効性を示しています。

OLMo 2 13B — 高性能の英語学術ベンチマーク言語モデル

MobileLLM-1B — Metaが開発した10億パラメーター以下の言語モデルで、デバイス上での利用に適しています。

MobileLLM-600M — デバイス向けアプリケーション用に設計された、効率的に最適化された6億パラメーターの言語モデル。

MobileLLM-350M — デバイス向けに設計された、効率的に最適化された10億パラメーター未満の言語モデル

LLM透明性ツール — Transformer言語モデルの内部動作メカニズムを分析します。

Qwen-VL — 汎用型ビジョン言語モデル

ハニービー — マルチモーダル言語モデル予測ネットワーク

Megatron-LM — 大規模Transformerモデルの継続的な研究開発

Inception Labs — Inception Labsは、次世代の拡散型大規模言語モデルを発表し、極めて高速で効率的で高品質な言語生成能力を提供します。

OpenManus — OpenManusは、招待コードなしで使用できるオープンソースのインテリジェントエージェントプロジェクトです。

Instella — Instellaは、AMDが開発した高性能なオープンソース言語モデルであり、オープンソース言語モデルの発展を加速するために設計されています。

QwQ-32B — QwQ-32Bは、複雑な問題解決とテキスト生成のために設計された、強力な推論モデルであり、優れたパフォーマンスを発揮します。

ART — 可変多層透明画像生成のための匿名領域変換技術です。

GPT-4.5 — OpenAIが発表した最新の言語モデルGPT-4.5は、教師なし学習能力の向上に重点を置き、より自然なインタラクション体験を提供します。

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Liteは、長文処理と多様なアプリケーションシナリオ向けに最適化された、高効率な言語モデルです。

Phi-4-mini-instruct — Phi-4-mini-instructは、高品質な推論集約型データに特化した軽量のオープンソース言語モデルです。

DeepSeek 日本語版 — DeepSeekは、論理推論、数学、プログラミングタスクに秀でた高度なAI言語モデルです。無料で利用できます。

AlphaMaze-v0.2-1.5B — 大規模言語モデルの視覚推論能力を向上させるための、テキスト迷路解決タスクを用いた革新的な手法

AlphaMaze — AlphaMazeは、視覚推論タスクに特化したデコーダー言語モデルであり、従来の言語モデルが視覚タスクで抱える課題を解決することを目指しています。

Smithery — Model Context Protocolサーバーを使用して、言語モデルの機能を拡張します。

Moonlight-16B-A3B — Moonlight-16B-A3Bは、Muon最適化器を用いてトレーニングされた160億パラメータの混合専門家モデルであり、効率的な言語生成を目的としています。

DeepHermes-3-Llama-3-8B-Preview — DeepHermes 3は、推論と通常の応答モードをサポートする大規模言語モデルです。

Lora — Loraは、iOSとAndroidに対応したモバイルデバイス向けに最適化されたローカル言語モデルです。

PaliGemma 2 mix — PaliGemma 2 mixは、多様なタスクと分野に適用可能な多機能ビジュアル言語モデルです。

MoBA — MoBAは、長文コンテキストに対応した混合ブロックアテンション機構であり、大規模言語モデルの効率化を目的としています。

Mistral Saba — Mistral Sabaは、中東および南アジア地域向けにカスタマイズされた地域言語モデルです。

OLMoEアプリ — Ai2 OLMoEは、iOSデバイスで動作するオープンソースの言語モデルアプリです。

Podscript — ポッドキャストやその他の音声ファイルの文字起こしテキストを生成するためのツールです。複数の言語モデルと音声認識APIに対応しています。

Xwen-Chat — Xwen-Chatは、日本語対話に特化した大規模言語モデルの集合体であり、複数バージョンのモデルと自然言語生成サービスを提供します。