InternVL2.5-MPOは、InternVL2.5と混合選好最適化に基づいた、高度なマルチモーダル大規模言語モデルシリーズです。増分事前学習済みのInternViTと、InternLM 2.5やQwen 2.5などの様々な事前学習済みの大規模言語モデルを統合し、ランダムに初期化されたMLPプロジェクターを使用しています。多画像・動画データに対応し、マルチモーダルタスクにおいて優れた性能を発揮し、画像関連のテキスト内容の理解と生成が可能です。