InternVL
オープンソースのビジョン基礎モデル
一般製品画像オープンソース基礎モデル
InternVLは、ViTモデルを60億パラメーターに拡張し、言語モデルとアライメントさせることで、現在最大の140億パラメーターのオープンソースビジョン基礎モデルを構築しました。これにより、視覚認識、クロスモーダル検索、マルチモーダル対話など幅広いタスクにおいて、32項目もの最先端性能を達成しています。
InternVL 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34