Marco-o1 ist ein offenes großes Inferenzmodell, das darauf ausgelegt ist, die Lösung komplexer Probleme der realen Welt durch fortschrittliche Technologien wie Chain-of-Thought (CoT)-Feinabstimmung, Monte-Carlo-Baumsuche (MCTS), Reflexionsmechanismen und innovative Inferenzstrategien zu optimieren. Das Modell konzentriert sich nicht nur auf Disziplinen mit standardisierten Antworten wie Mathematik, Physik und Programmierung, sondern betont auch die Lösung offener Probleme. Marco-o1 wurde vom MarcoPolo-Team von Alibaba International Digital Commerce entwickelt, verfügt über leistungsstarke Inferenzfähigkeiten und hat in verschiedenen Bereichen überragende Leistungen gezeigt.