QVQ-72B-PreviewはQwenチームが開発した実験的な研究モデルであり、視覚推論能力の強化に焦点を当てています。このモデルは、多様な分野の理解と推論において強力な能力を示し、特に数学的推論タスクにおいて著しい進歩を遂げています。視覚推論において進歩が見られる一方で、QVQはQwen2-VL-72Bを完全に代替するものではなく、複数ステップの視覚推論においては、画像内容への注意が徐々に低下し、幻覚が生じる可能性があります。さらに、QVQは基本的な認識タスクにおいて、Qwen2-VL-72Bよりも著しく優れた改善を示していません。