InternVL2_5-4B

視覚と言語理解を融合したマルチモーダル大規模言語モデル。

一般製品画像マルチモーダル大規模言語モデル
InternVL2_5-4Bは、高度なマルチモーダル大規模言語モデル(MLLM)です。InternVL 2.0をベースにコアモデルアーキテクチャを維持しつつ、トレーニングとテスト戦略、データ品質を大幅に強化しました。本モデルは、画像、テキスト間変換タスクにおいて優れた性能を発揮し、特にマルチモーダル推論、数学問題解決、OCR、グラフおよび文書理解において顕著な成果を上げています。オープンソースモデルとして、研究者や開発者が視覚と言語に基づくインテリジェントアプリケーションの探求と構築に役立つ強力なツールを提供します。
ウェブサイトを開く

InternVL2_5-4B 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

InternVL2_5-4B 訪問数の傾向

InternVL2_5-4B 訪問地理的分布

InternVL2_5-4B トラフィックソース

InternVL2_5-4B 代替品