Marco-o1は、Chain-of-Thought (CoT)ファインチューニング、モンテカルロ木探索 (MCTS)、反射機構、そして革新的な推論戦略などの高度な技術を用いて、複雑な現実世界の課題解決を最適化する、オープンな大規模推論モデルです。標準的な解答を持つ数学、物理、プログラミングなどの分野だけでなく、開放的な問題解決にも重点を置いています。アリババ国際デジタルビジネスのMarcoPoloチームによって開発されたMarco-o1は、強力な推論能力を備え、複数の分野で卓越した性能を示しています。