InternVL2_5-1B
画像とテキストの理解をサポートするマルチモーダル大規模言語モデル
一般製品画像マルチモーダル大規模言語モデル
InternVL 2.5は、一連の高度なマルチモーダル大規模言語モデル(MLLM)です。InternVL 2.0をベースに、大幅なトレーニングとテスト戦略の強化、データ品質の向上により、コアモデルアーキテクチャを維持しています。このモデルは、増分事前学習済みのInternViTと、InternLM 2.5やQwen 2.5などの様々な事前学習済み大規模言語モデル(LLM)を、ランダムに初期化されたMLPプロジェクターを使用して統合しています。InternVL 2.5はマルチ画像およびビデオデータをサポートし、動的な高解像度トレーニング手法により、マルチモーダルデータ処理能力が強化されています。
InternVL2_5-1B 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44