最近清华大学的研究团队针对提升LLM智能体能力的问题,提出了AgentTuning方法。该方法包含构建AgentInstruct智能体数据集和采用混合指令微调策略。作者利用AgentTuning对Llama 2系列进行微调,得到AgentLM。结果表明,AgentLM相比Llama 2在多种智能体任务上取得明显提升,70B版本在许多任务上甚至超过GPT-4,提供了开源的强大替代方案。该研究为LLM在智能体任务领域发展提供了新的思路,也为未来实现更智能化的智能体系统奠定了基础。
最近清华大学的研究团队针对提升LLM智能体能力的问题,提出了AgentTuning方法。该方法包含构建AgentInstruct智能体数据集和采用混合指令微调策略。作者利用AgentTuning对Llama 2系列进行微调,得到AgentLM。结果表明,AgentLM相比Llama 2在多种智能体任务上取得明显提升,70B版本在许多任务上甚至超过GPT-4,提供了开源的强大替代方案。该研究为LLM在智能体任务领域发展提供了新的思路,也为未来实现更智能化的智能体系统奠定了基础。
字节跳动正式推出其最新的豆包大模型1.5Pro(Doubao-1.5-pro),这一新模型在多个领域的综合能力上表现出色,成功超越了行业内知名的 GPT-4o 和 Claude3.5Sonnet。该模型的发布标志着字节跳动在人工智能领域又向前迈出了重要一步。豆包1.5Pro 采用了新型的稀疏 MoE(混合专家)架构,使用较小的激活参数进行预训练。这种设计的创新之处在于其可以提供等效于7倍激活参数的 Dense 模型性能,使其在效率上远超行业常规的 MoE 架构,带来了约3倍的效率提升。这样的设计使得豆包大模型在知识、代码
谷歌研究院近日发布了革新性的"Titans"系列模型架构,通过仿生设计实现了突破性的200万Token上下文长度,并计划在未来开源相关技术。这一架构的核心创新在于引入深度神经长期记忆模块,其设计灵感来源于人类记忆系统。Titans巧妙地结合了短期记忆的快速响应能力和长期记忆的持久性特征,同时运用注意力机制来处理即时上下文,形成了一个高效的信息处理体系。据谷歌介绍,Titans在长序列处理任务中展现出显著优势。无论是在语言建模还是时间序列预测方面,这一架构都实现了突破性
2025年1月20日,豆包 App 正式发布了其最新的 “端到端” 语音大模型,并对实时语音通话功能进行了重要更新。这一进展标志着豆包在语音交互领域的又一次飞跃,超越了之前的 ASR(自动语音识别)、LLM(大语言模型)和 TTS(文生音频)的级联方案,将语音识别、理解和生成整合在同一个模型中。经过《智能涌现》的测试,新版豆包的最大亮点在于其具备了人类般的表达能力和情感输出,提升了对话的流畅度与智能水平。尤其是 “灵魂歌手” 和 “百变大咖” 模式,让豆包不仅能够进行唱歌,
近日,一项由奥地利复杂科学研究所(CSH)主导的研究显示,尽管大型语言模型(LLMs)在多项任务中表现优异,但在应对高级历史问题时却暴露了短板。研究团队针对三大顶尖模型进行测试,包括 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini,结果让人失望。图源备注:图片由AI生成,图片授权服务商Midjourney为了评估这些模型在历史知识上的表现,研究者们开发了一个名为 “Hist-LLM” 的基准测试工具。该工具依据 Seshat 全球历史数据库,旨在验证 AI 回答历史问题的准确性。研究结果在知名人工智