Marco-o1 est un grand modèle de raisonnement ouvert conçu pour optimiser les tâches de résolution de problèmes complexes du monde réel grâce à des techniques de pointe telles que l'ajustement fin Chain-of-Thought (CoT), la recherche arborescente de Monte-Carlo (MCTS), les mécanismes de réflexion et des stratégies d'inférence innovantes. Ce modèle ne se concentre pas uniquement sur les disciplines ayant des réponses standardisées, comme les mathématiques, la physique et la programmation, mais met également l'accent sur la résolution de problèmes ouverts. Développé par l'équipe MarcoPolo d'Alibaba International Digital Commerce, Marco-o1 possède de puissantes capacités de raisonnement et a démontré des performances exceptionnelles dans plusieurs domaines.