微软提出全自动AI框架Auto Evol-Instruct：利用大语言模型演进指导数据集，无需人为干预

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jul 18, 2024

545

最近，微软的研究人员提出了一种名为 Auto Evol-Instruct 的全新 AI 框架，这个框架可以自动演进指导数据集，无需任何人为干预。

在人工智能领域，大型语言模型（LLMs）的发展至关重要，尤其是在提高这些模型遵循详细指令的能力方面。研究人员一直在探索如何改进用于训练 LLMs 的数据集，以提高模型的性能和适应性。

传统的演进方法如Evol-Instruct依赖于人类专家指定的演进规则，这不仅昂贵耗时，而且在适应新任务时需要重新设计方法。相比之下，Auto Evol-Instruct通过首先使用LLMs分析输入指令，并自主设计演进规则的初始方法，实现了自动化演进过程。随后，通过优化器LLMs对演进方法进行迭代优化，识别和解决演进过程中的问题，确保最终的演进指令复杂性和稳定性。

Auto Evol-Instruct 通过自动分析输入指令并制定演进规则，利用 LLMs 设计演进方法，从而提高数据集的复杂性和多样性。

在性能评估方面，Auto Evol-Instruct在多个基准测试中表现出色。例如，仅使用10K个演进的ShareGPT数据对Mixtral-8x7B进行微调，框架在MT-Bench上达到了8.09分，在AlpacaEval上达到了91.4分，超过了GPT-3.5-Turbo和WizardLM-70B，并与Claude2.0相当。

此外，通过仅使用7K个演进的GSM8K训练数据，框架在GSM8K上达到了82.49分，在代码生成方面，通过使用20K个演进的Code Alpaca对DeepSeek-Coder-Base-33B进行微调，框架在HumanEval上达到了77.4分，超过了其他竞争模型。

可见，这个全新的框架在多个基准测试中表现出色，包括 MT-Bench、AlpacaEval、GSM8K 和 HumanEval，展现出其在提高指令遵循、数学推理和代码生成能力方面的潜力。

论文地址：https://arxiv.org/abs/2406.00770

划重点:
🔍 Auto Evol-Instruct 是一个全自动的 AI 框架，能够自动分析和演进指导数据集，无需人为干预。
🚀 框架通过优化演进方法，有效提高了数据集的复杂性和多样性，从而增强了 LLMs 在各种任务中的性能和适应性。
💡 Auto Evol-Instruct 的研究结果表明，通过自动化演进指导数据集的方法。

AI头条

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI日报：腾讯元宝升级一句话搜索图片视频；微信支付MCP上线；谷歌在全球推出 Veo 3

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、腾讯元宝再升级:一句话搜索，图片视频即刻呈现，信息获取更直观!腾讯元宝的升级功能让信息获取更加直观和高效，用户只需一句话提问即可获得图文并茂的回答，无论是学习新技能还是解决生活难题都变得更加简单。【AiBase提要:】🧠 一句话搜索，智能匹配图片和视频号内容💡 学习新技

2025年7月4号 16:39

1.7k

字节跳动开源Trae-Agent，助力智能开发新体验

今日，字节跳动旗下AI原生集成开发环境（IDE）Trae宣布正式开源其核心组件Trae-Agent，为全球开发者带来全新智能编程体验。据官方推文(@Trae_ai)透露，开发者现可通过`git clone`和`cd trae-agent`快速获取并体验这一智能开发助手。Trae-Agent是字节跳动打造的智能开发工具，支持自然语言驱动的编程任务自动化，极大提升开发效率。其核心亮点包括:- **多模型支持**:兼容OpenAI、Anthropic等多种大语言模型，安装配置简便，灵活适配不同开发需求。- **强大功能集成**:内置文件编辑、脚本执行等工具，支

2025年7月4号 16:24

3.9k

微信支付MCP上线：AI与支付的完美结合，开启商业新纪元

近日，微信支付正式推出了 MCP功能，为 AI 应用的商业化铺平了道路。这一举措不仅弥补了 AI 在 “赚钱” 环节的短板，还让我们看到了科技巨头在 AI 时代的战略布局。首先，MCP 的推出为 AI 赋能的应用程序开辟了新的盈利渠道。以往，用户在与 AI 交互时往往只停留在 “陪聊” 层面，难以实现商业变现。而如今，微信支付 MCP 允许 AI 在与用户互动时直接进行支付。例如，当用户要求 AI 创作一首诗时，AI 可以生成付款二维码，让用户先进行支付，完成后再享受创作的成果。这一模式简化了

2025年7月4号 16:06

4.7k

Figma 拟以约 200 亿美元估值登陆纽交所，AI 设计未来可期

位于旧金山的云端协作设计软件公司 Figma 正式向美国证券交易委员会（SEC）提交了 IPO 申请，计划以股票代码 FIG 在纽约证券交易所（NYSE）上市。据最新消息，Figma 的目标估值约为 200亿美元，有望成为2025年最受瞩目的科技 IPO 之一。本文由 AIbase 编辑团队整理，基于网络公开信息，深入剖析 Figma 的上市背景、技术创新与市场前景。Figma 的崛起:从设计工具到产品开发生态Figma 成立于2012年，由 Dylan Field 和 Evan Wallace 创立，最初定位于浏览器端的界面设计工具，强调实时协作与云端存储。其核

2025年7月4号 15:32

2.4k

日立能源警告：AI 中心的电力需求波动可能威胁全球电力供应稳定

近日，世界最大变压器制造商日立能源的首席执行官安德烈亚斯・施里伦贝克（Andreas Schierenbeck）在接受《金融时报》采访时指出，随着大科技公司在训练人工智能模型时电力需求的激增，政府需要采取措施来限制这种波动，以确保电力供应的稳定。图源备注：图片由AI生成，图片授权服务商Midjourney施里伦贝克表示，AI 数据中心的电力需求波动极其剧烈，这与传统办公数据中心截然不同。他解释说，在启动 AI 算法进行数据处理时，电力需求可能在几秒钟内激增，使用量达到平时的十倍。他

2025年7月4号 14:34

890

Meta 推出主动聊天机器人，让 AI 先行一步与你对话

最近，Meta正在测试一种新型的聊天机器人，这些机器人将主动向用户发送消息，而不仅仅是在用户发起对话后进行回应。想象一下，你正在 Facebook Messenger 或 WhatsApp 上与朋友聊天，突然间，一个名为 “The Maestro of Movie Magic” 的 AI 聊天机器人给你发来了一条消息:“希望你今天过得愉快!我想知道你最近有没有发现什么新的电影原声带或作曲家?或者，是否需要我为你推荐一些下一个电影之夜的好片呢?”据泄露的文件显示，Meta 与数据标注公司 Alignerr 合作，开发出这些可定制的聊天机器人。用

2025年7月4号 14:13

2.5k

腾讯元宝再升级:一句话搜索，图片视频即刻呈现，信息获取更直观!

智能助手元宝今日宣布重磅升级其核心搜索功能，推出“一句话能搜的更多了”全新特性。现在，用户只需简单一句提问，元宝便能智能匹配并呈现图片和视频号内容，让信息获取变得前所未有的丰富与直观。过去，元宝已能轻松应对天气查询、股价查询、地点查找等日常需求。而此次升级，则将元宝的智能搜索能力推向新高度。无论是想要学习一项新技能，还是解决生活中的小难题，元宝都能通过整合文字、图片和视频号，为用户提供“手把手”的教学体验。一句话搜索出视频号:学新技

2025年7月4号 14:11

3.0k

Cluely 短短一周内年收入翻倍至700万美元

在硅谷风头正劲的初创公司 Cluely，近日宣布其年经常性收入（ARR）在推出新企业产品后迅速飙升至约700万美元。这一增长速度令创始人 Roy Lee 感到兴奋，他向《科技 Crunch》表示:“每一个进行会议或面试的人，都在试用这个产品。”Cluely 致力于利用人工智能分析在线对话，实时提供会议记录、背景信息和提问建议，所有信息都悄然呈现在用户的屏幕上，而其他人却无法察觉。在新产品发布之前，Lee 曾自豪地表示，公司年收入已超过300万美元，并且盈利。他指出，这一增长趋势得益于消费

2025年7月4号 14:07

2.0k

脑虎科技创始人彭雷预测脑机接口未来五年五大颠覆性趋势

在2025亚布力中国企业家论坛第十一届创新年会上，脑虎科技创始人兼董事长彭雷深入探讨了脑机接口（BCI）技术的未来发展，并提出了未来五年该领域的五大新趋势，这些趋势有望彻底改变人类的生活方式和科技格局。1. 脑机与脊髓结合:瘫痪患者的希望彭雷指出，脑机接口与脊髓的结合将是未来一大趋势。由于大脑和脊髓紧密相连，高位截瘫患者的脊髓损伤阻碍了神经信号的传导。未来，通过在头部植入脑机接口并在背部植入髓机接口，有望使瘫痪患者重新站立，恢复行动能力。2. 视觉

2025年7月4号 11:44

1.9k

E Ink 推出 AI 触控板:电子纸技术或将改变笔记本电脑交互方式

E Ink 公司近日宣布，他们开发出一种用于笔记本电脑的全新触控板，该触控板采用了与电子阅读器相同的电子纸技术。这款创新产品并非简单地增大触控板尺寸或增加次要显示功能，而是将其定位为 AI 应用和助手的专用平台，旨在与主流操作系统并行运行。E Ink 发布的一张样机图片展示了升级后的触控板，它配备了彩色电子墨水屏幕，类似于亚马逊 Kindle Colorscreen 等设备所使用的技术。E Ink 的设想是，该屏幕将作为一个独立的区域，让用户在处理文档时，AI 生成的文本摘要能够直接呈现在

2025年7月4号 11:15

1.7k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

​微软提出全自动AI框架Auto Evol-Instruct：利用大语言模型演进指导数据集，无需人为干预