在人工智能领域,一项颠覆性的技术正在悄然兴起。近日,Inception Labs 宣布推出 Mercury 系列扩散大型语言模型(dLLMs),这是一种新一代的语言模型,旨在快速、高效地生成高质量文本。与传统的自回归大型语言模型相比,Mercury 在生成速度上提高了多达10倍,能够在 NVIDIA H100显卡上实现超过每秒1000个标记的速度,这一速度在以往仅依靠定制芯片才能实现。
Mercury 系列的首款产品 Mercury Coder,已在公共测试中亮相。该模型专注于代码生成,展现了出色的性能,并且在多个编程基准测试中超越了许多现有的速度优化模型,如 GPT-4o Mini 和 Claude3.5Haiku,同时在速度上也快了近10倍。根据开发者反馈,Mercury 的代码完成效果更受欢迎,在 C o p i l o t Arena 的测试中,Mercury Coder Mini 在性能上名列前茅,并且是最快的模型之一。
当前的语言模型大多采用自回归方式,即从左到右逐个生成标记,导致生成过程不可避免地是顺序的,延迟和计算成本较高。而 Mercury 则采用 “粗到细” 的生成方式,从纯噪声开始,经过几次 “去噪” 步骤,逐步精细化输出。这使得 Mercury 模型能够在生成时进行多标记的并行处理,从而实现更好的推理和结构化响应能力。
随着 Mercury 系列的推出,Inception Labs 展示了扩散模型在文本和代码生成领域的巨大潜力。接下来,公司还计划推出适用于聊天应用的语言模型,进一步拓展扩散语言模型的应用场景。这些新型模型将具备更强的智能代理能力,能够进行复杂的规划和长时间的生成。同时,它们的高效性使得在资源受限的设备上也能运行良好,例如智能手机和笔记本电脑。
总的来看,Mercury 的推出标志着人工智能技术的一次重要进步,不仅在速度和效率上大幅提升,也为行业提供了更高质量的解决方案。
官方介绍:https://www.inceptionlabs.ai/news
在线体验:https://chat.inceptionlabs.ai/
划重点:
🌟 Mercury 系列扩散大型语言模型(dLLMs)推出,生成速度提高至每秒1000个标记。
🚀 Mercury Coder 专注于代码生成,在基准测试中超越众多现有模型,表现优异。
💡 扩散模型的创新方式使得文本生成更加高效、精准,为智能代理应用提供新的可能性。