阿里国际AI团队开源开放型问题推理模型Marco-o1

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月26号 8:28

256

阿里巴巴国际AI团队最近发布了一款名为Marco-o1的新型推理模型，该模型特别关注开放型问题的解决，不仅局限于具有标准答案的学科领域，如编程和数学。研究团队致力于探索这类模型能否有效推广到难以量化且缺乏明确奖励的领域。

微信截图_20241126082757.png

Marco-o1模型的特点包括使用超长CoT数据进行微调、利用MCTS扩展解空间、细粒度解空间扩展等。模型通过self-play+MCTS构建了一批具备反思和改正能力的超长CoT数据，并结合其他开源数据一同训练。此外，研究团队还定义了mini-Step来进一步扩大模型的解空间，引导模型输出更优秀的答案。

在翻译任务中，Marco-o1模型展现了其处理长难句翻译的能力，这是首次将推理时扩展应用到机器翻译任务中。研究团队开源了部分CoT数据和目前最好的模型，并计划未来开源更多数据与模型。

微信截图_20241126082711.png

模型在推理时会对response进行深入思考，例如在输出单词‘strawberry’中‘r’的数量时，模型会逐步拆解单词中的每一个字母并比较，最终正确输出结果。在机器翻译领域，模型通过推理链路正确识别难点，逐词翻译，提高了整体的翻译准确性。

研究团队还在其他领域进行了尝试，证明了该模型具备解决其他通用现实问题的能力。Marco-o1的整体结构通过self-play+MCTS构建了一批具备反思、改正能力的超长CoT数据，并结合其他开源数据一同训练。研究团队还融入了MarcoPolo家族的一些指令遵循数据集，提升了模型的指令遵循能力。

使用方法方面，研究团队提供了推理代码和微调代码，用户可以轻松地加载模型和分词器，并开始聊天或微调模型。此外，该模型也可以在ModelScope上的GGUF版本直接运行，提供了一种更快捷的体验方式。

Marco-o1模型的发布，标志着阿里巴巴国际AI团队在推理模型领域迈出了重要的一步，为解决开放型问题提供了新的思路和工具。

ModelScope:

https://modelscope.cn/models/AIDC-AI/Marco-o1

Arxiv:

https://arxiv.org/abs/2411.14405

Github:

https://github.com/AIDC-AI/Marco-o1

Hugging Face:

https://huggingface.co/AIDC-AI/Marco-o1

抖音副总裁否认AI团队大变阵：都是不实信息

李亮指出，一篇题为《字节AI团队大变阵》的文章中存在多处不实信息。文章中提及的技术副总裁杨震原即将退休、冯佳时将离职创业等说法，均为错误信源所致。此外，关于张一鸣拜访豌豆荚创始人王俊煜及上海模速空间创业公司的报道，同样与事实不符。

OpenAI 在全球扩展人工智能代理服务Operator，提升用户体验

OpenAI 于上周五宣布，正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展，旨在帮助用户更高效地完成各种日常任务。Operator 自今年1月在美国首次推出以来，便备受关注，成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。它能够完成多种操作，包括订票、预订餐厅、提交费用报告，甚至在电子商务网站上购物。这些功能不仅

OpenAI宣布面向多个国家推出AI代理 Operator

OpenAI 于周五宣布，将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家，为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务，包括订票、预订餐厅、提交费用报告和网上购物等。“Operator” 最初于今年1月在美国推出，作为市场上几款 “人工智能代理” 工具之一，OpenAI 希望通过这一产品，为用户提供更便捷的服务。需要注意的是，这一工具目前仅对每月付费200美元的 ChatGPT Pro 用户开放，用户可以通过

Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”（AI CUDA Engineer），这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核，显著提升机器学习操作的运行效率。根据X平台上的最新消息，该系统通过进化的大型语言模型(LLM)驱动代码优化技术，将常见PyTorch操作的运行速度提高了10至100倍，标志着AI技术在GPU性能优化领域的重大突破。Sakana AI表示，CUDA内核作为GPU计算的核心，直接编写和优化通常需要深厚的专业知识和高技术门槛，而现有框架如PyTorch虽然使用便捷，但在性能上往