Cohere新开源AI模型Aya Expanse，能力碾压谷歌、Meta同规模模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月25号 10:53

439

近日，Cohere 宣布推出两款新的开源 AI 模型，旨在通过其 Aya 项目缩小基础模型的语言差距。这两款新模型名为 Aya Expanse8B 和35B，现已在 Hugging Face 上提供使用。这两个模型的推出，让23种语言的 AI 性能得到了显著提升。

Cohere 在其博客中表示，8B 参数模型让全球研究人员能更轻松地获得突破，而32B 参数模型则提供了业界领先的多语言能力。

Aya 项目的目标是扩展更多非英语语言的基础模型访问。在此之前，Cohere 的研究部门去年启动了 Aya 计划，并在2月份发布了 Aya101大语言模型（LLM），这款模型涵盖了101种语言。此外，Cohere 还推出了 Aya 数据集，以帮助在其他语言上进行模型训练。

Aya Expanse 模型在构建过程中沿用了 Aya101的许多核心方法。Cohere 表示，Aya Expanse 的改进是基于多年来在机器学习突破领域重新思考核心构建块的结果。他们的研究方向主要集中在缩小语言差距，取得了一些关键性突破，如数据套利、针对一般性能和安全性的偏好训练以及模型合并等。

在多项基准测试中，Cohere 表示，Aya Expanse 的两个模型表现超越了 Google、Mistral 和 Meta 等公司同类规模的 AI 模型。

其中，Aya Expanse32B 在多语言基准测试中的表现超越了 Gemma227B、Mistral8x22B，甚至是更大的 Llama3.170B。而小型的8B 模型同样超越了 Gemma29B、Llama3.18B 和 Ministral8B，胜率从60.4% 到70.6% 不等。

为了避免生成难以理解的内容，Cohere 采用了一种名为数据套利的数据采样方法。这种方法能够更好地训练模型，尤其是针对低资源语言时更为有效。此外，Cohere 还专注于引导模型朝向 “全球偏好”，并考虑不同文化和语言的视角，进而提高模型的性能与安全性。

Cohere 的 Aya 计划力求确保 LLM 在非英语语言的研究上能够有更好的表现。虽然许多 LLM 最终会推出其他语言版本，但在训练模型时常常面临数据不足的问题，尤其是对于低资源语言。因此，Cohere 的努力在帮助构建多语言 AI 模型方面显得尤为重要。

官方博客:https://cohere.com/blog/aya-expanse-connecting-our-world

划重点:
🌍 **Cohere 推出两款新 AI 模型 **，致力于缩小基础模型的语言差距，支持23种语言的性能提升。
💡 **Aya Expanse 模型表现优异 **，在多语言基准测试中超越了许多同类竞争对手。
🔍 ** 数据套利方法 ** 帮助模型避免生成低质量内容，关注全球文化与语言视角，提高了多语言 AI 的训练效果。

多家知名出版商起诉AI初创公司Cohere涉嫌侵犯版权

近日，包括康泰纳仕（Condé Nast）、《大西洋月刊》(The Atlantic)和《福布斯》(Forbes)在内的14家出版商联合起诉 AI 初创公司 Cohere，指控其存在 “系统性” 的版权侵犯行为。根据投诉，出版商们指责 Cohere 在训练其 AI 模型时使用了至少4，000部受版权保护的作品，并且在向用户展示时显示了大量文章的片段，甚至是整篇文章，严重影响了出版商的引流流量。此外，诉状还指出 Cohere 通过 “虚构” 的内容侵犯了出版商的商标，这些内容并非实际由这些出版物发布。Cohere 的沟通负责人乔希・加特

Cohere重磅推出安全AI平台“North”，挑战微软与谷歌！

Cohere 公司今日宣布推出其最新的 AI 平台 “North”，旨在为企业用户提供一个安全的工作空间，直接挑战微软的 C o p i l ot 和谷歌的 Vertex AI。Cohere 声称，这一新平台在金融、人力资源、客户支持和 IT 等多个领域的性能上优于这两大科技巨头。“North” 结合了大型语言模型、搜索能力和自动化工具，以一个安全的包装形式，让企业在保持对敏感数据控制的同时，能够高效地部署 AI 技术。该平台支持私有云环境或本地安装，特别针对金融和医疗等受监管行业进行设计。Cohere 的内部测试显示，

AI独角兽Cohere与Palantir深度合作：企业级AI应用浮出水面

作为OpenAI和Anthropic之外最受关注的AI初创公司之一，Cohere在 7 月份的估值已高达 55 亿美元。这家公司的联合创始人之一正是“Attention Is All You Need”论文的作者，这篇论文被认为是引发大型语言模型（LLM）革命的关键。Cohere总部位于多伦多和旧金山，专注于为企业客户提供AI解决方案，而不是像其他公司那样推出爆款消费级聊天机器人。虽然Anthropic上个月因与Palantir和AWS达成向国防客户出售AI的协议而登上新闻头条，但TechCrunch获悉，Palantir也是Cohere的合作伙伴。据Palantir发布的一段视频中透露

Cohere 推出 Command R7B 模型：小型高效，可在低端设备运行

在快速发展的人工智能领域，Cohere 公司近日推出了其最新模型 Command R7B，标志着该公司在为企业提供高效解决方案方面又向前迈出了重要一步。作为 R 系列中最小、速度最快的模型，Command R7B 专注于支持快速原型开发和迭代，采用了检索增强生成（RAG）技术，提升了模型的准确性。Command R7B 具有128K 的上下文长度，能够支持23种语言，这让它在多语言处理和不同领域的应用中展现出强大的能力。Cohere 公司表示，Command R7B 在数学、编码等任务上优于同类模型，包括谷歌的 Gemma、Meta 的 Llama 以

AI新闻资讯