超越Gemma2！IBM发布Granite3.1模型：支持128K上下文长度

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月19号 9:49

261

IBM 正式发布了其新一代开源大语言模型 Granite3.1，力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

IBM 声称，Granite8B Instruct 模型在相同规模的开源竞争对手中表现最佳，包括 Meta 的 Llama3.1、Qwen2.5和谷歌的 Gemma2。

Granite3.1模型的发布是在 IBM 快速迭代 Granite 系列的背景下进行的，早在10月份就推出了 Granite3.0。IBM 透露，其与生成 AI 相关的业务收入已达到20亿美元。新版本的核心理念是将更多功能集成到更小的模型中，以便企业用户能够更轻松地运行和更具成本效益。

IBM 研究部副总裁大卫・考克斯（David Cox）表示，Granite 模型广泛应用于 IBM 内部产品、咨询服务以及客户服务，同时也以开源形式发布，因此需要在各个方面都达到高水平。模型的性能评估不仅仅依赖于速度，还包括效率，帮助用户在获取结果时节省时间。

在上下文长度方面，Granite3.1的提升尤为明显，从初版的4K 扩展至128K，这对企业 AI 用户尤为重要，尤其是在检索增强生成（RAG）和智能代理 AI 方面。延长的上下文长度允许模型处理更长的文档、日志和对话，使其更好地理解和响应复杂查询。

IBM 还推出了一系列嵌入模型，以加快数据转换为向量的过程。其中 Granite-Embedding-30M-English 模型的查询时间为0.16秒，速度优于竞争对手的产品。为了实现 Granite3.1的性能提升，IBM 在多阶段训练流程和高质量训练数据的使用上进行了创新。

在幻觉检测方面，Granite3.1模型将幻觉保护集成到了模型内部，能够自我检测并减少错误输出。这种内置检测功能优化了整体效率，减少了推理调用次数。

当前，Granite3.1模型已向企业用户免费开放，并通过 IBM 的 Watsonx 企业 AI 服务提供。未来，IBM 计划保持快速更新的节奏，Granite3.2将于2025年初推出多模态功能。

官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful-performance-long-context-and-more

划重点:
🌟 IBM 推出 Granite3.1模型，旨在开源大语言模型市场占据领先地位。
💡 新模型支持128K 上下文长度，显著提升了处理能力与效率。
🚀 幻觉检测功能被集成到模型中，优化了整体性能和准确性。

挑战开源AI新高度:DeepSeek V3超越Llama3.1，训练数据达14.8万亿token

中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1，在多项基准测试中的表现也优于包括GPT-4在内的主流封闭源模型。DeepSeek V3的突出特点在于其强大的性能与高效的开发过程。该模型在编程平台Codeforces的竞赛中表现出色，并在测试代码集成能力的Aider Polyglot测试中领先竞争对手。模型训练采用了14.8万亿token的庞大数据集，参数规模达到了Llama3.1的1.6倍。更引人注目的是，DeepSeek仅用两个月时间、550万美元成

AI独角兽Cohere与Palantir深度合作：企业级AI应用浮出水面

作为OpenAI和Anthropic之外最受关注的AI初创公司之一，Cohere在 7 月份的估值已高达 55 亿美元。这家公司的联合创始人之一正是“Attention Is All You Need”论文的作者，这篇论文被认为是引发大型语言模型（LLM）革命的关键。Cohere总部位于多伦多和旧金山，专注于为企业客户提供AI解决方案，而不是像其他公司那样推出爆款消费级聊天机器人。虽然Anthropic上个月因与Palantir和AWS达成向国防客户出售AI的协议而登上新闻头条，但TechCrunch获悉，Palantir也是Cohere的合作伙伴。据Palantir发布的一段视频中透露

谷歌发布PaliGemma 2:AI能"读懂"情绪？专家质疑其科学性和伦理风险

谷歌近日推出了全新的AI模型家族PaliGemma2，其最引人注目的功能是声称能够通过图像分析"识别"人类情绪。这一宣称迅速引发了学术界和技术伦理专家的广泛讨论和严重质疑。这款基于Gemma开放模型的AI系统能够生成详细的图像描述，不仅仅停留在简单的物体识别，还试图描述图像中人物的行为和情感。然而，多位权威专家对这一技术的科学性和潜在风险提出了严重警告。来自牛津互联网研究所的数据伦理教授桑德拉·瓦赫特直言不讳地指出，试图通过AI"读取"人类情绪如同"问魔法八号球寻求

谷歌新AI模型PaliGemma2引发情绪识别争议:隐患与挑战并存

谷歌日前发布了其新一代人工智能模型——PaliGemma2，该技术能分析图像并生成标题，同时回答关于照片中人物的情感和行动等问题。PaliGemma2基于谷歌的 Gemma 开放模型系列，提供比传统物体识别更为深刻的图像描述，能够识别情绪并生成符合上下文的详细描述。然而，尽管这一技术看似突破性创新，专家却对其潜在的伦理和社会影响提出了严重警告。情绪识别并非PaliGemma2的标准功能，而是通过微调实现的。尽管谷歌表示其已进行了“广泛测试”，并且在人口统计学偏见方面表现优于行业基

AI新闻资讯