新微调框架 LoRA-Dash：高效应对特任务，算力需求大幅降低

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月16号 15:03

224

近日，来自上海交通大学和哈佛大学的研究团队推出了一种全新的模型微调方法 ——LoRA-Dash。这个新方法声称比现有的 LoRA 方法更加高效，特别是在特定任务的微调中，它可以在参数量减少8到16倍的情况下，依然达到相同的效果。这无疑是对那些需要大量计算资源的微调任务的一次重大突破。

在大规模语言模型快速发展的背景下，微调特定任务的需求日益增长。然而，微调往往需要消耗大量的计算资源。为了解决这一问题，研究团队引入了参数高效微调（PEFT）策略，LoRA 就是一个典型的例子。通过实验发现，LoRA 主要是通过捕捉一些预训练中已学习到的特征并放大，从而达到微调的效果。

然而，LoRA 的原论文在 “特定任务方向”（TSD）的定义上存在一些模糊之处。研究团队对此进行了深入分析，首次对 TSD 进行了严格的定义，并明确了它的性质。TSD 代表着在微调过程中，模型参数中显著变化的核心方向。

为了解放 TSD 在实际应用中的潜力，研究人员提出了 LoRA-Dash，这一方法包含两个关键阶段。第一个阶段是 “预启动阶段”，此时需要识别出任务特定的方向;第二个阶段是 “冲刺阶段”，利用之前识别的方向进行优化调整，使模型更好地适应特定任务。

实验表明，LoRA-Dash 在多个任务上都超越了 LoRA 的表现，例如在常识推理、自然语言理解和主体驱动生成等任务中都取得了显著的性能提升。这一成果显示了 TSD 在下游任务中的有效性，充分释放了高效微调的潜力。

目前，相关研究论文已公开，代码也已开源，研究团队希望能够为更多的研究者和开发者提供支持，让大家在微调模型的过程中更加高效。

项目入口:https://chongjiesi.site/project/2024-lora-dash.html

** 划重点:**
🌟 **LoRA-Dash 方法推出:** 新的模型微调方法 LoRA-Dash 应运而生，相较于 LoRA 更为高效，算力需求大幅降低。
⚡ ** 明确特定任务方向:** 研究团队对 “特定任务方向”（TSD）进行了严格的定义，阐明其在微调过程中的重要性。
🚀 ** 显著实验成果:** 实验显示 LoRA-Dash 在常识推理、自然语言理解等任务中表现优于 LoRA，展现了高效微调的巨大潜力。

黑森林实验室推FLUX Pro微调API，仅用五张样本图像就能定制AI模型

德国人工智能初创公司 Black Forest Labs （黑森林实验室）近日发布了一款FLUX Pro 微调 API，用户可以通过这款 API 使用仅仅五张样本图像来定制 FLUX Pro AI 图像模型，以匹配特定品牌的视觉风格。据 Black Forest Labs 介绍，经过微调后，模型仍然保持灵活性，能够将用户提供的内容融入到新的图像创作中，该系统能够生成最高达四百万像素的高分辨率图像。借助 FLUX Pro 微调 API，创作者可以利用自己的图片和概念对 FLUX.1[pro] 进行定制，从而更好地控制最终结果。用户提供的图像可用于训练 FLUX Pro 模

OpenAI开放满血o1模型API：成本降低60% 新增高级视觉处理能力

在为期12个工作日的连续直播活动中，OpenAI在第9天面向开发者发布了o1模型的API，并宣布对实时API进行重大升级，支持WebRTC技术。自发布日起，OpenAI将向API使用等级5级的开发者提供o1API的访问权限。此次更新的o1模型API相较于之前的预览版本，在思考成本上实现了60%的降低，并新增了高级视觉处理能力。同时，GPT-4o在音频处理上的成本也减少了60%，而mini版本的价格也大幅下降了10倍。

科大讯飞星火低代码智能体平台全新升级智能体模板上线

科大讯飞股份有限公司近日宣布其星火低代码智能体平台全新升级，星火低代码智能体平台的升级，通过快速搭建和灵活定制，大大缩短了开发周期，拓展了应用场景，并通过数据集成提高了智能体的决策准确性。平台升级后，用户可以免费创建有价值的AI Agent，接入微调平台实现定制优化，升级RAG方案扩充专业知识，并上线创建模板降低开发门槛。

高质量数据才是王道！EPFL 研究：训练数据对大模型性能至关重要！

瑞士洛桑联邦理工学院（EPFL）的一项最新研究比较了两种主流的大型语言模型 (LLM) 适应性训练方法:上下文学习 (ICL) 和指令微调 (IFT)。研究人员使用 MT-Bench 基准测试来评估模型遵循指令的能力，发现在特定情况下，两种方法的表现各有优劣。研究发现，当可用的训练样本数量较少时（例如不超过50个），ICL 和 IFT 的效果非常接近。这表明在数据有限的情况下，ICL 或许可以作为 IFT 的替代方案。然而，随着任务复杂度的增加，例如在多轮对话场景中，IFT 的优势就变得明显。研究人员认为，

AI新闻资讯

​新微调框架 LoRA-Dash：高效应对特任务，算力需求大幅降低