Marco-o1 é um modelo de raciocínio em larga escala e aberto, projetado para otimizar tarefas de resolução de problemas complexos do mundo real por meio de técnicas avançadas como ajuste fino Chain-of-Thought (CoT), busca em árvore Monte Carlo (MCTS), mecanismos de reflexão e estratégias de raciocínio inovadoras. O modelo não se concentra apenas em disciplinas com respostas padrão, como matemática, física e programação, mas também enfatiza a resolução de problemas abertos. Desenvolvido pela equipe MarcoPolo do Alibaba International Digital Commerce, o Marco-o1 possui poderosa capacidade de raciocínio e demonstrou desempenho excepcional em diversos domínios.