InternVL2_5-26B-MPO
視覚と言語のインタラクション能力を向上させた、多様なモダリティに対応する大規模言語モデルです。
一般製品画像多様なモダリティ大規模言語モデル
InternVL2_5-26B-MPOは、多様なモダリティに対応する大規模言語モデル(MLLM)です。InternVL2.5をベースに、混合選好最適化(Mixed Preference Optimization, MPO)を用いてモデル性能をさらに向上させています。画像やテキストを含む多様なモダリティのデータを処理でき、画像キャプション生成、ビジュアルクエスチョン・アンサーリングなど幅広い用途に適用可能です。画像の内容と密接に関連したテキストの理解と生成が可能である点が重要であり、多様なモダリティに対応する人工知能の境界を押し広げています。製品の背景情報には、多様なモダリティに対応するタスクにおける卓越した性能と、OpenCompass Leaderboardにおける評価結果が含まれます。本モデルは、研究者や開発者が多様なモダリティに対応する人工知能の可能性を探求し、実現するための強力なツールを提供します。
InternVL2_5-26B-MPO 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44