InternVL2_5-26B

視覚と言語理解を融合したマルチモーダル大規模言語モデル。

一般製品画像マルチモーダル大規模言語モデル
InternVL2_5-26Bは、InternVL 2.0をベースに、大幅なトレーニングとテスト戦略の強化、データ品質の向上によって発展させた、高度なマルチモーダル大規模言語モデル(MLLM)です。本モデルは、前身の「ViT-MLP-LLM」の中核モデルアーキテクチャを保持しており、新たに増量プレトレーニングされたInternViTと、InternLM 2.5やQwen 2.5などの様々なプレトレーニング済み大規模言語モデル(LLM)を、ランダム初期化されたMLPプロジェクタを用いて統合しています。InternVL2 2.5シリーズのモデルは、マルチモーダルタスク、特に視覚認識とマルチモーダル能力において優れた性能を発揮しています。
ウェブサイトを開く

InternVL2_5-26B 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

InternVL2_5-26B 訪問数の傾向

InternVL2_5-26B 訪問地理的分布

InternVL2_5-26B トラフィックソース

InternVL2_5-26B 代替品