Meta推出Llama3.370B:新一代AI模型性能超越GPT-4和Gemini1.5Pro

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Dec 7, 2024

304

Meta近日宣布，推出其Llama系列的最新成员——Llama3.370B。Meta的生成式AI副总裁Ahmad Al-Dahle在X平台上发布了这一消息，并指出，Llama3.370B在性能上相较于Meta之前最大的Llama模型Llama3.1405B取得了显著进步，同时成本大幅降低。

Al-Dahle表示，通过利用训练后的最新技术，Llama3.370B不仅提升了性能，而且降低了运营成本。根据Meta发布的基准测试结果，Llama3.370B在多个领域超过了谷歌的Gemini1.5Pro、OpenAI的GPT-4和亚马逊新发布的Nova Pro，尤其在评估模型理解语言能力的MMLU测试中表现优异。

该模型现已可以从Hugging Face和Llama官方平台等来源下载，Meta的这一举措旨在通过“开放”模型来主导AI领域。Meta的Llama模型可以应用于多种场景，并支持商业化，虽然Meta对一些开发者设定了使用限制，要求每月用户超过7亿的平台申请特别许可。尽管如此，Llama模型的下载量已突破6.5亿次，表明其在全球AI开发者中受到了广泛欢迎。

为了支撑未来更大规模的AI模型训练，Meta正在大力投资计算基础设施。该公司近日宣布将在路易斯安那州建设一个100亿美元的AI数据中心，这是Meta迄今为止规模最大的AI数据中心。扎克伯格在财报电话会议中提到，为了训练下一代Llama4模型，所需的计算能力将是Llama3的10倍。Meta目前已采购超过10万个Nvidia GPU集群，与xAI等竞争对手的资源相匹敌。

随着生成式AI模型训练的成本不断攀升，Meta的资本支出也呈现增长趋势，2024年第二季度的资本支出增长了近33%，达到了85亿美元。这一增长主要得益于Meta在服务器、数据中心和网络基础设施上的持续投资。

Llama3.370B 生成式AI Meta MMLU测试

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

阿里推出OmniTalker：AI视频生成技术再突破，单参考视频实现风格化语音与表情同步

近日，阿里巴巴旗下研发团队发布了一项名为“OmniTalker”的全新AI技术项目，该项目凭借其惊艳的视频生成能力迅速引发业界关注。据悉，OmniTalker仅需一段参考视频，便能精准捕捉视频中人物的语音风格与面部表情，并以此为基础生成唇形同步、表情自然的动态视频。这一技术的亮相，不仅展现了阿里在生成式AI领域的深厚实力，也为视频内容创作带来了革命性的可能性。OmniTalker的核心优势在于其“零样本学习”能力。传统AI视频生成技术往往需要大量训练数据、复杂的模型调参或专业配

2025年4月7号 17:40

700

作者集会抗议Meta盗用作品训练 AI，版权问题引发热议

上周，约100名作家在 Meta 位于伦敦的总部外发起抗议，指责这家美国科技巨头未经许可 “盗用” 他们的作品用于训练人工智能模型。抗议者高喊着 “Meta，Meta，书籍小偷”，一些人还举着标语，内容包括 “我本想写个标语，但你们会偷走它” 和 “让扎克回我们的书里”，这显然是针对 Meta 首席执行官马克・扎克伯格的调侃。早前，关于扎克伯格批准公司使用一个名为 “LibGen” 的在线图书馆的消息引发关注。这个图书馆提供对超过750万本书的访问，许多作品可能是 Meta 训练 AI 模型的基

2025年4月7号 16:41

6.9k

AI日报：Kimi宣布降价；OpenRouter发布免费模型Quasar Alpha；Midjourney V7重磅上线

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、IDC：到2028年中国人工智能投资将突破1000亿美元根据国际数据公司的预测，中国在人工智能领域的投资将显著增长，预计到2028年总投资将突破1000亿美元，年均复合增长率达到35.2%。即梦AI作为一款创新产品，旨在为创意爱好者提供多功能平台，支持AI图片创作和视频制作。

2025年4月7号 15:36

1.7k

IDC：到2028年中国人工智能投资将突破1000亿美元

国际数据公司（IDC）发布了《全球人工智能和生成式人工智能支出指南》，预计到2028年，中国人工智能总投资将突破1，000亿美元，年均复合增长率达到35.2%。根据 IDC 的数据显示，2024年全球人工智能 IT 总投资预计为3，158亿美元，至2028年将增至8，159亿美元，年均复合增长率为32.9%。而在生成式 AI 方面，全球市场将在未来五年内以63.8% 的速度增长，到2028年市场规模将达到2，842亿美元，占到整体 AI 市场投资的35%。中国市场方面，IDC 指出，中国将继续引领亚太地区的人工智能市场，其支出预

2025年4月7号 14:23

8.6k

Meta 发布 Llama 4 大模型：混合专家架构引领 AI 新时代

Meta 公司推出了其最新的开源人工智能模型 Llama4，标志着其在人工智能领域的又一重大进展。Llama4分为两个版本，分别命名为 Scout 和 Maverick，旨在提升 AI 模型的功能与表现。Meta 表示，Llama4是一个多模态大模型，能够处理文本、图像、视频和音频等多种数据类型，并能在这些格式之间自由转换。值得一提的是，Llama4系列首次采用了 “混合专家”（MoE）架构，这一新颖设计极大地提高了模型的训练和响应效率。通过将模型划分为多个专注于特定任务的 “专家” 子模型，Llama4在处理复杂查询

2025年4月7号 9:47

3.8k

一周数据干翻七年苦练？微软模型WHAMM实时生成《雷神之锤II》可玩Demo

近日，科技巨头微软公开了一项引人注目的研究项目——WHAMM（World and Human Action MaskGIT Model）。这是一个创新的人工智能模型，能够完全在AI模型内部生成并运行经典游戏《雷神之锤II》，实时呈现可供玩家操作的游戏版本。这项研究隶属于微软的Co pil ot Labs，旨在探索生成式AI在互动媒体领域的潜力与边界。颠覆传统:AI模型直接生成可玩游戏与以往的游戏AI主要集中在控制游戏角色或生成游戏内容片段不同，WHAMM的独特之处在于它能够从零开始生成整个游戏环境和动态过程，并且能够响应玩

2025年4月7号 9:34

3.9k

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

Meta周六发布了其新旗舰AI模型Maverick，该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而，多位AI研究人员很快发现，Meta部署到LM Arena的Maverick版本似乎与开发人员广泛使用的版本存在显著差异。Meta在公告中承认，LM Arena上的Maverick是一个"实验性聊天版本"。与此同时，Llama官方网站上的图表显示，Meta的LM Arena测试使用的是"针对对话性进行了优化的Llama4Maverick"。这种差异引发了研究社区的质疑。AI研究人员在社交平台X上指出，公开可

2025年4月7号 9:20

3.0k

Meta 官宣开源原生多模态 Llama 4，性能强劲引关注

美国科技巨头 Meta 推出了其最强大的开源人工智能模型 Llama4。此次首批发布共两款，分别是 Llama4Scout 和 Llama4Maverick 。Llama4Scout 共有1090亿参数，170亿活跃参数，16个专家，最大亮点是支持1000万上下文，这相当于可以处理20+ 小时的视频，并且仅在单个 H100GPU（Int4量化后）上就能运行。在基准测试中，其性能超越 Gemma3、Gemini2.0Flash - Lite、Mistral3.1。Llama4Maverick 共有4000亿参数，170亿活跃参数，128个专家，100万上下文。在大模型 LMSYS 排行榜上，Llama4Maverick 冲上第二（ELO 得分1417），仅次于闭源 Ge

2025年4月6号 9:39

8.5k

DeepSeek 与清华联合研究:创新奖励模型推理方法，提升可扩展性

近日，DeepSeek 和清华的研究者发布新论文，探讨了奖励模型的推理时 Scaling 方法，让 DeepSeek R2似乎更近一步。目前，强化学习在大语言模型的大规模后训练阶段广泛应用，但面临为大语言模型获取准确奖励信号的挑战。研究者发现，采用点式生成式奖励建模（GRM）能提升模型适应能力和推理阶段可扩展性。为此，他们提出自我原则点评调优(SPCT)学习方法，经此训练得到 DeepSeek - GRM 模型，如基于 Gemma -2-27B 训练的 DeepSeek - GRM -27B。实验显示，SPCT 显著提高了 GRM 的质量和可扩展性，在多个基准

2025年4月5号 9:39

8.4k

字节跳动推出DreamActor-M1：实现Runway Act 功能，挑战动画生成新高度

近日，字节跳动（ByteDance）正式公布了其最新AI项目“DreamActor-M1”，一项旨在革新视频生成技术的前沿成果。这款模型通过结合一张静态照片和一段参考动作视频，能够将照片中的人物无缝替换到视频场景中，生成表情细腻、动作自然且画质高清的动态影像。这一技术的亮相，不仅标志着字节跳动在生成式AI领域的又一次突破，也被视为对现有动画生成工具(如Runway的Act-One)的有力挑战。DreamActor-M1的核心创新在于其对细节的精准把控和一致性表现。传统图像到视频的生成方法往往面临诸多难

2025年4月3号 18:03

3.4k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图