Rhymes AI发布首款开源多模态AI模型Aria 性能超越GPT-4o mini等多家知名AI模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月11号 10:03

772

最近，日本东京的初创公司 Rhymes AI 推出了他们的首款人工智能模型 ——Aria。该公司自称，Aria 是全球首个开源的多模态混合专家（MoE）模型。这个模型不仅具有处理多种输入模态的能力，还声称在能力上与一些知名的商业模型不相上下，甚至更胜一筹。

Aria 的设计理念是希望能够在文本、代码、图像和视频等多种输入形式上，提供卓越的理解和处理能力。与传统的 Transformer 模型不同，MoE 模型通过多个专业的专家来替代其前馈层。当处理每个输入令牌时，一个路由模块会选择一部分专家进行激活，从而提高计算效率，减少每个令牌的激活参数数量。

Aria 的解码器每个文本令牌可以激活35亿个参数，整个模型拥有249亿个参数。为了处理视觉输入，Aria 还设计了一款轻量级的视觉编码器，拥有4.38亿个参数，可以将各种长度、大小和纵横比的视觉输入转换为视觉令牌。此外，Aria 的多模态上下文窗口达到64，000个令牌，意味着它能处理更长的输入数据。

在训练方面，Rhymes AI 共分为四个阶段，先用文本数据进行预训练，再引入多模态数据，接着是长序列的训练，最后进行微调。

在此过程中，Aria 总共使用了6.4万亿个文本令牌和4000亿个多模态令牌进行预训练，数据来自 Common Crawl 和 LAION 等知名数据集，并进行了部分合成增强。

根据相关基准测试，Aria 在多个多模态、语言和编程任务中表现优于 Pixtral-12B 和 Llama-3.2-11B 等模型，并且因激活参数较少，推理成本也较低。

此外，Aria 在处理带有字幕的视频或多页文档时表现良好，其理解长视频和文档的能力超过了 GPT-4o mini 和 Gemini1.5Flash 等其他开源模型。

为便于使用，Rhymes AI 将 Aria 的源代码以 Apache2.0许可证形式发布在 GitHub 上，支持学术和商业使用。同时，他们还提供了一个训练框架，可以在单个 GPU 上对 Aria 进行多种数据源和格式的微调。值得一提的是，Rhymes AI 与 AMD 达成了合作，以优化模型性能，展示了一款名为 BeaGo 的搜索应用，该应用能够在 AMD 硬件上运行，为用户提供更全面的文本和图像 AI 搜索结果。

划重点:
🌟 Aria 是全球首个开源的多模态混合专家 AI 模型。
💡 Aria 在处理文本、图像和视频等多种输入时，表现出色，超越了许多同行模型。
🤝 Rhymes AI 与 AMD 合作，优化模型性能，并推出支持多种功能的 BeaGo 搜索应用。

网易有道子曰-o1推理模型正式开源发布专为消费级显卡设计

“子曰-o1”是一款14B轻量级单模型，专为消费级显卡设计，能够在低显存设备上稳定运行。该模型采用思维链技术，能够提供详细的解题过程和逻辑推理，其运行思路更接近人类的思考方式。通过“自言自语”和自我纠错的方式，模型可以输出分步解题过程，帮助用户更好地理解和掌握知识。

法国AI初创公司Mistral计划上市，而非被收购

法国初创公司 Mistral AI，作为开源 AI 领域的崭新力量，近日宣布计划上市，而非被收购。Mistral 的首席执行官兼联合创始人阿图尔・门施（(Arthur Mensch）)在接受彭博电视采访时表示:“我们并不出售。” 此前曾有传闻称，微软可能会收购该公司，部分原因是微软向 Mistral 投资了1500万欧元(约合1560万美元)并与其建立了合作关系。门施补充说，目前 Mistral 并不需要融资，因为公司拥有充足的资金。Mistral 成立于2023年4月，创始团队由来自谷歌深度学习部门 DeepMind 和 Meta 的前工程师组成。门施表示

国产开源大模型 DeepSeek R1 发布，性能超越o1模型、成本降90%

正文:近期，中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1，受到了广泛关注。R1模型的性能表现极其出色，在多项测试中均超越了 OpenAI 的 o1模型，尤其是在数学和编程方面的评估中表现优异。在最新的美国 AIME2024测试中，R1以79.8分的成绩超越 o1的79.2分。在 MATH-500测试中，R1获得了97.3分，同样领先于 o1的96.4分。此外，在 SWE-bench Verified 测试中，R1得分为49.2，也超过了 o1的48.9分。虽然在代码测试 Codeforces 中，R1仅比 o1低0.3分，但整体性能与 o1模型相当。除了性能，R1的成本优势更为引人

国产大模型再突破！DeepSeek R1开源，性能直逼OpenAI，开启AI平权新时代

DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1，该模型在性能上表现出色，被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破，也为全球AI开发者带来了新的选择。DeepSeek R1在后训练阶段大规模应用了强化学习技术，即便是在极少标注数据的情况下，也显著提升了模型的推理能力。在数学、代码、自然语言推理等关键任务上，DeepSeek R1的性能均能与OpenAI o1正式版平分秋色，展示了其强大的实力。为了回馈开源社区，DeepSeek同时开源了DeepSeek-R1和De

AI新闻资讯

Rhymes AI发布首款开源多模态AI模型Aria 性能超越GPT-4o mini等多家知名AI模型

AIbase基地

相关AI新闻推荐

网易有道子曰-o1推理模型正式开源发布 专为消费级显卡设计

法国AI初创公司Mistral计划上市，而非被收购

​国产开源大模型 DeepSeek R1 发布，性能超越o1模型、成本降90%

国产大模型再突破！DeepSeek R1开源，性能直逼OpenAI，开启AI平权新时代

网易有道子曰-o1推理模型正式开源发布专为消费级显卡设计

国产开源大模型 DeepSeek R1 发布，性能超越o1模型、成本降90%