AI2推出开源 Tülu3模型，性能与GPT-4o mini相当

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Dec 10, 2024

236

在人工智能领域，后训练技术正逐渐成为提升模型性能的重要手段。近日，艾伦人工智能研究所（AI2）发布了 Tülu3系列模型，这是一套完全开源的先进语言模型，性能与 GPT-4o-mini 等闭源相媲美。Tülu3不仅包含了模型数据、代码、训练配方，还提供了评估框架，旨在推动开源模型后训练技术的发展。

传统上，仅经过预训练的模型往往无法有效满足实际应用需求，可能会产生有毒或危险的信息，且难以遵循人类指令。因此，后训练阶段如指令微调和人类反馈学习显得尤为重要。然而，如何优化后训练过程仍然是一个技术难题，尤其是在提升模型某一能力的同时，可能会影响到其他能力。

为了攻克这一难题，各大公司纷纷提升了后训练方法的复杂性，尝试多轮训练和结合人工与合成数据，但大部分方法仍为闭源。与之形成对比的是，Tülu3系列的发布，突破了开源模型和闭源模型之间的性能差距，带来了全新的训练思路。

Tülu3的训练过程分为四个阶段:数据构造、监督微调、偏好调整和可验证奖励的强化学习。

首先，研究人员聚焦于模型的核心技能，通过人工数据与合成数据的结合来构建训练数据。

其次，进行监督式微调，以确保模型在特定技能上的表现不逊色于其他先进模型。

第三，采用直接偏好优化的方法来进一步提升模型的整体表现。最后，创新引入可验证奖励强化学习的方法，帮助模型更好地完成可验证结果的任务。

Tülu3模型基于 Llama3.1的基础上进行构建，在推理、数学、编程和指令遵循等领域表现优异。与其他开源和闭源模型相比，Tülu3的综合能力在多个基准测试中表现出色，标志着开源后训练技术的一次重大进步。

论文链接:https://allenai.org/papers/tulu-3-report.pdf

Demo:https://playground.allenai.org/

划重点:
🌟 Tülu3是 AI2推出的开源语言模型，与闭源模型如 GPT-4o-mini 性能相当。
🔧 后训练技术至关重要，能够有效提升模型在实际应用中的表现。
📊 Tülu3的训练过程创新，分为数据构造、监督微调、偏好调整和可验证奖励强化学习四个阶段。

后训练技术 Tülu3 GPT-4o-mini 人工智能研究所

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后，OpenAI并未停下在该领域探索的脚步，现在这家ChatGPT的创造者再次发力，推出了三款全新的自主研发语音模型，分别为:gpt-4o-transcribe， gpt-4o-mini-transcribe and gpt-4o-mini-tts。其中最受瞩目的当属gpt-4o-transcribe。目前，这些新模型已经率先通过应用程序接口（API）向第三方开发者开放，开发者们可以利用它们打造更智能的应用程序。同时，OpenAI也提供了一个名为OpenAI.fm的演示网站，供个人用户进行初步体验。核心功能大揭秘那么，这款备受期待的 gpt-4o-transcr

2025年3月21号 9:01

6.5k

32B参数的“逆袭”！OLMo 2 32B横空出世，叫板GPT-3.5 Turbo

近日，艾伦人工智能研究所（AI2）重磅发布了其最新的大型语言模型——OLMo232B。这款模型一经亮相便自带光环，因为它不仅是OLMo2系列的最新力作，更以“完全开放”的姿态，向那些高墙深垒的专有模型发起了强有力的挑战。OLMo232B最引人注目的特点莫过于其彻彻底底的开源属性。AI2大方地公开了这款模型的所有数据、代码、权重以及详细的训练过程. 这种“坦诚相见”的做法，与一些讳莫如深的闭源模型形成了鲜明对比。AI2希望通过这种开放协作的方式，促进更广泛的研究和创新，让全

2025年3月18号 14:53

4.0k

AI2开源训练方案Tülu 3，打破大模型后训练技术垄断

在开源AI领域，与大型科技公司的差距不仅仅体现在算力上。AI2（前Allen人工智能研究所）正通过一系列开创性举措缩小这一鸿沟，其最新发布的Tülu3后训练方案，让"原始"大语言模型转化为实用AI系统变得触手可及。与普遍认知不同，基础语言模型在预训练后并不能直接投入使用。事实上，后训练过程才是决定模型最终价值的关键环节。正是在这个阶段，模型从一个"无所不知"却缺乏判断力的网络，转变为具有特定功能导向的实用工具。长期以来，各大公司对后训练方案讳莫如深。虽然任何

2024年11月22号 10:08

1.9k

OpenAI 推出 “预测输出” 功能：将 GPT-4o 速度提升约 5 倍

大型语言模型如 GPT-4o 和 GPT-4o-mini 的出现，推动了自然语言处理领域的重大进步。这些模型能够生成高质量的响应，进行文档重写，以及提升各类应用的生产力。然而，这些模型面临的一个主要挑战就是响应生成的延迟。在更新博客或优化代码的过程中，这种延迟可能会严重影响用户体验，尤其是在需要多次迭代的场景下，如文档修改或代码重构，用户往往会感到沮丧。为了应对这一挑战，OpenAI 推出了 “预测输出（Predicted Outputs ）” 功能，这一功能显著减少了 GPT-4o 和 GPT-4o-mini 的延迟，

2024年11月5号 15:29

3.6k

全新开源 AI 模型 Molmo 横扫业界巨头，超越 GPT-4o 与 Claude 3.5

近日，艾伦人工智能研究所（Ai2）发布了 Molmo，这是一个全新的开源多模 AI 模型家族，表现出色，甚至在多个第三方基准测试中超越了 OpenAI 的 GPT-4o、Anthropic 的 Claude3.5Sonnet 和谷歌的 Gemini1.5。Molmo 不仅能接受用户上传的图像进行分析，还使用了 “比竞争对手少1000倍的数据” 进行训练，这得益于其独特的训练技巧。这次发布展示了 Ai2对开放研究的承诺，提供了高性能的模型以及开放的权重和数据，供更广泛的社区和企业使用。Molmo 家族包括四个主要模型，分别是 Molmo-72B、Molmo-7B-D、Molmo-

2024年9月26号 18:01

6.2k

OpenAI新模型gpt-4o-2024-08-06以及gpt-4o-mini支持结构化输出

OpenAI在API中新增结构化输出功能，确保生成的输出完全符合预设的JSON架构，显著提升API的可靠性和应用的精确度。这一功能不仅定义了JSON的结构，还确保了输出的准确性。同时，价格下调，输入价格降低一半，输出成本减少1/3。结构化输出的引入，解决了JSON模式在保证输出符合特定架构方面的局限性，显著提升模型在结构化输出方面的表现。通过技术革新，如受限解码技术，实现了模型输出与JSON Schema的完美匹配。此功能在API中以函数调用和参数新选项的形式呈现，支持所有模型和工具。结构化输出在实际应用中展现出广泛的用途，从动态界面到数据提取，都能实现高效、精确的数据处理。安全政策得到遵循，Python和Node SDK已更新，支持结构化输出，简化了开发流程。这一功能的推出，为AI技术在数据处理和应用开发领域带来了新的可能。

2024年8月7号 8:33

8.3k

艾伦人工智能研究所发布全球首个100%开源大模型

["艾伦人工智能研究所、华盛顿大学等联合发布全球首个100%开源大模型，包括权重、代码、数据集和训练全过程。","该模型名为OLMo，提供完整的训练和建模资料，包括多个不同架构、优化器和训练硬件下的7B大小的模型。","性能评估显示OLMo-7B在多项任务中表现略胜一筹，特别在与Common Crawl数据源相关的任务上表现出色。","研究人员还公开了预训练数据集Dolma，其中包含3万亿个token，推动语言模型预训练领域的开放研究。","为了加强数据透明度，研究人员开源了数据整理工具和分析工具，促进学术界对OLMo的深入研究。"]

2024年2月4号 10:58

200

Allen人工智能研究所发布首个开源语言模型OLMo

["Allen人工智能研究所发布全球首个开放语言模型OLMo，旨在促进人工智能领域的合作研究。","首批模型包括7B和1B规模的变体，覆盖不同架构和训练硬件，为未来更大规模的模型奠定基础。","OLMo在评估中显示在生成任务和阅读理解上领先于Llama2，成为流行模型的有力替代品。","模型架构采用最新趋势，包括SwiGLU激活函数、Rotary位置嵌入等，极大推动了人工智能领域的发展。","未来，A12计划推出不同尺寸、模态、数据集、安全措施和评估方法，构建全球最卓越的开放语言模型。"]

2024年2月2号 11:22

290

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

​AI2推出开源 Tülu3模型，性能与GPT-4o mini相当