AI巨头Yann LeCun在参议院为开源大模型Llama辩护,强调开源的重要性,将人工智能视为基础设施,并支持合作制定标准和治理模式。开源模型有助于民主化访问最先进的技术,减少社会差距。合作制定人工智能标准和治理模式是迫切需要的。Yann LeCun支持相关立法,愿意与公司内相关人员合作
AI巨头Yann LeCun在参议院为开源大模型Llama辩护,强调开源的重要性,将人工智能视为基础设施,并支持合作制定标准和治理模式。开源模型有助于民主化访问最先进的技术,减少社会差距。合作制定人工智能标准和治理模式是迫切需要的。Yann LeCun支持相关立法,愿意与公司内相关人员合作
据第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。图源备注:图片由AI生成,图片授权服务商Midjourney据知情人士透露,小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧,因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼,她拥有北京大学计算语言学研究所的硕士学位,并在自然语言处理领域的顶级会议 ACL2019上发表了
IBM 正式发布了其新一代开源大语言模型 Granite3.1,力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。IBM 声称,Granite8B Instruct 模型在相同规模的开源竞争对手中表现最佳,包括 Meta 的 Llama3.1、Qwen2.5和谷歌的 Gemma2。Granite3.1模型的发布是在 IBM 快速迭代 Granite 系列的背景下进行的,早在10月份就推出了 Granite3.0。IBM 透露,其与生成 AI 相关的业务收入已达到20亿美元。新版本的核心理念是将更多功能集成到更小的
在 AI 时代,大型语言模型(LLM)就像武林秘籍,其训练过程耗费巨大算力、数据,就像闭关修炼多年的武林高手。而开源模型的发布,就像高手将秘籍公之于众,但会附带一些许可证(如 Apache2.0和 LLaMA2社区许可证)来保护其知识产权(IP)。然而,江湖险恶,总有“套壳”事件发生。一些开发者声称自己训练了新的 LLM,实际上却是在其他基础模型(如 Llama-2和 MiniCPM-V)上进行包装或微调。 这就好像偷学了别人的武功,却对外宣称是自己原创的。为了防止这种情况发生,模型所有者和第三方迫
近日,甲骨文公司(Oracle)在其2025财年第二季度财报中宣布,公司的总收入同比增长9%,达到了141亿美元。其中,云服务收入达到59亿美元,同比增长 %。这一增长与全球对人工智能(AI)需求激增密切相关。图源备注:图片由AI生成,图片授权服务商Midjourney在财报电话会议上,甲骨文首席技术官拉里・埃里森(Larry Ellison)透露,骨文已与 Meta 签署了一项协议,将使用 Meta 的 AI 云基础设施,并合作开发基于 Meta Llama 模型的 AI 代理。这表明甲骨文在 AI 领域的布局正持续深化。甲骨文首席执行官