InternVL2_5-4B
視覚と言語理解を融合したマルチモーダル大規模言語モデル。
一般製品画像マルチモーダル大規模言語モデル
InternVL2_5-4Bは、高度なマルチモーダル大規模言語モデル(MLLM)です。InternVL 2.0をベースにコアモデルアーキテクチャを維持しつつ、トレーニングとテスト戦略、データ品質を大幅に強化しました。本モデルは、画像、テキスト間変換タスクにおいて優れた性能を発揮し、特にマルチモーダル推論、数学問題解決、OCR、グラフおよび文書理解において顕著な成果を上げています。オープンソースモデルとして、研究者や開発者が視覚と言語に基づくインテリジェントアプリケーションの探求と構築に役立つ強力なツールを提供します。
InternVL2_5-4B 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44