InternVL2_5-4B-MPO-AWQ
画像とテキストの相互作用能力を最適化した多様なモダリティを持つ大規模言語モデル
一般製品画像多様なモダリティ大規模言語モデル
InternVL2_5-4B-MPO-AWQは、画像とテキストの相互作用タスクにおけるモデルのパフォーマンス向上に焦点を当てた、多様なモダリティを持つ大規模言語モデル(MLLM)です。InternVL2.5シリーズをベースとし、混合嗜好最適化(MPO)によって性能がさらに向上しています。単一画像や複数画像、動画データなど、多様な入力に対応可能であり、画像とテキストの相互理解が必要な複雑なタスクに適しています。InternVL2_5-4B-MPO-AWQはその優れた多様なモダリティ能力により、画像とテキストからテキストを生成するタスクに強力なソリューションを提供します。
InternVL2_5-4B-MPO-AWQ 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44