Mercury：首个商用级别的Diffusion LLM，速度快、手机也能部署

在人工智能领域，一项颠覆性的技术正在悄然兴起。近日，Inception Labs 宣布推出 Mercury 系列扩散大型语言模型（dLLMs），这是一种新一代的语言模型，旨在快速、高效地生成高质量文本。与传统的自回归大型语言模型相比，Mercury 在生成速度上提高了多达10倍，能够在 NVIDIA H100显卡上实现超过每秒1000个标记的速度，这一速度在以往仅依靠定制芯片才能实现。

Mercury 系列的首款产品 Mercury Coder，已在公共测试中亮相。该模型专注于代码生成，展现了出色的性能，并且在多个编程基准测试中超越了许多现有的速度优化模型，如 GPT-4o Mini 和 Claude3.5Haiku，同时在速度上也快了近10倍。根据开发者反馈，Mercury 的代码完成效果更受欢迎，在 C o p i l o t Arena 的测试中，Mercury Coder Mini 在性能上名列前茅，并且是最快的模型之一。

当前的语言模型大多采用自回归方式，即从左到右逐个生成标记，导致生成过程不可避免地是顺序的，延迟和计算成本较高。而 Mercury 则采用 “粗到细” 的生成方式，从纯噪声开始，经过几次 “去噪” 步骤，逐步精细化输出。这使得 Mercury 模型能够在生成时进行多标记的并行处理，从而实现更好的推理和结构化响应能力。

随着 Mercury 系列的推出，Inception Labs 展示了扩散模型在文本和代码生成领域的巨大潜力。接下来，公司还计划推出适用于聊天应用的语言模型，进一步拓展扩散语言模型的应用场景。这些新型模型将具备更强的智能代理能力，能够进行复杂的规划和长时间的生成。同时，它们的高效性使得在资源受限的设备上也能运行良好，例如智能手机和笔记本电脑。

总的来看，Mercury 的推出标志着人工智能技术的一次重要进步，不仅在速度和效率上大幅提升，也为行业提供了更高质量的解决方案。

官方介绍:https://www.inceptionlabs.ai/news

在线体验:https://chat.inceptionlabs.ai/

划重点:
🌟 Mercury 系列扩散大型语言模型（dLLMs）推出，生成速度提高至每秒1000个标记。
🚀 Mercury Coder 专注于代码生成，在基准测试中超越众多现有模型，表现优异。
💡 扩散模型的创新方式使得文本生成更加高效、精准，为智能代理应用提供新的可能性。

AI新闻资讯

Mercury：首个商用级别的Diffusion LLM，速度快、手机也能部署

AIbase基地