InternVL2_5-2B

画像とテキストの深層的な相互作用をサポートする、マルチモーダル大規模言語モデルです。

一般製品画像マルチモーダル大規模言語モデル
InternVL 2.5は、高度なマルチモーダル大規模言語モデルシリーズです。InternVL 2.0をベースに、大幅な訓練とテスト戦略の強化、データ品質の向上により、コアモデルアーキテクチャを維持しています。このモデルは、増分事前学習されたInternViTと、InternLM 2.5やQwen 2.5などの様々な事前学習済み大規模言語モデルを統合し、ランダム初期化されたMLPプロジェクターを使用しています。InternVL 2.5は、マルチ画像とビデオデータをサポートし、動的な高解像度訓練方法を備えており、マルチモーダルデータ処理において優れた性能を発揮します。
ウェブサイトを開く

InternVL2_5-2B 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

InternVL2_5-2B 訪問数の傾向

InternVL2_5-2B 訪問地理的分布

InternVL2_5-2B トラフィックソース

InternVL2_5-2B 代替品