AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

亚马逊机器学习团队发布 Mistral 7B 基础模型

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Oct 10, 2023

亚马逊机器学习团队近日宣布,开发的 Mistral7B 基础模型已在 SageMaker JumpStart 提供,用户可以一键部署使用。Mistral7B 是参数规模达 70 亿的英文文本代码生成模型,采用 transformer 架构,具有 8000 个 token 的上下文长度,可以实现较快的推理速度。用户可以轻松体验 Mistral7B,该模型以 Apache2.0 许可开源,无限制使用。

Mistral7B 参数规模上下文长度

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

无需训练！Q-Filters 实现 KV 缓存高效压缩，提升推理性能

近年来，基于 Transformer 架构的大型语言模型（LLMs）取得了显著进展，诸如 Gemini-Pro1.5、Claude-3、GPT-4和 Llama-3.1等新模型能够处理成百上千的token。然而，这些扩展的上下文长度带来了实际应用中的一些重大挑战。随着序列长度的增加，解码延迟上升，内存限制也成为了一个严重的瓶颈。KV 缓存在推理过程中储存上下文信息，随着上下文长度的增加，缓存的大小也呈比例增长，这导致内存饱和，严重影响了处理长输入序列的效率，因此迫切需要优化解决方案。虽然市场上存在一些无训练的方

2025年3月7号 16:19

2.5k

阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场

继 DeepSeek R1之后，阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M，再次引发业界关注。此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。这是通义千问首次推出能够原生支持百万Token上下文长度的模型，并在推理速度上实现了显著提升。Qwen2.5-1M 的核心亮点在于其原生支持百万 Token 的超长上下文处理能力。这使得模型能够轻松应对书籍、长篇报告、法律文件等超长文档，无需进行繁琐的分割处理。同时，该模型还支持更长时间、更深入的对话

2025年1月27号 11:08

8.1k

谷歌发布Titans:仿生设计突破200万Token上下文长度

谷歌研究院近日发布了革新性的"Titans"系列模型架构，通过仿生设计实现了突破性的200万Token上下文长度，并计划在未来开源相关技术。这一架构的核心创新在于引入深度神经长期记忆模块，其设计灵感来源于人类记忆系统。Titans巧妙地结合了短期记忆的快速响应能力和长期记忆的持久性特征，同时运用注意力机制来处理即时上下文，形成了一个高效的信息处理体系。据谷歌介绍，Titans在长序列处理任务中展现出显著优势。无论是在语言建模还是时间序列预测方面，这一架构都实现了突破性

2025年1月21号 10:08

1.7k

超越Gemma2！IBM发布Granite3.1模型：支持128K上下文长度

IBM 正式发布了其新一代开源大语言模型 Granite3.1，力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。IBM 声称，Granite8B Instruct 模型在相同规模的开源竞争对手中表现最佳，包括 Meta 的 Llama3.1、Qwen2.5和谷歌的 Gemma2。Granite3.1模型的发布是在 IBM 快速迭代 Granite 系列的背景下进行的，早在10月份就推出了 Granite3.0。IBM 透露，其与生成 AI 相关的业务收入已达到20亿美元。新版本的核心理念是将更多功能集成到更小的

2024年12月19号 9:49

3.4k

阿里云发布逆天大模型Qwen2.5-Turbo 一口气读完十本小说，推理速度提升4.3倍！

阿里云重磅推出全新升级的Qwen2.5-Turbo大语言模型，其上下文长度突破至惊人的100万Token。这相当于什么概念?相当于10部《三体》，150小时的语音转录或3万行代码的容量!这回可真是“一口气读完十本小说”不是梦了!Qwen2.5-Turbo模型在Passkey Retrieval任务中实现了100%的准确率，并且在长文本理解能力方面超越了GPT-4等同类模型。该模型在RULER长文本基准测试中取得了93.1的高分，而GPT-4的得分仅为91.6，GLM4-9B-1M的得分则为89.9。除了超长文本处理能力，Qwen2.5-Turbo还兼具短文本处理的精准性，在短文本

2024年11月19号 14:23

8.5k

aiOS：第一个基于Mistral7B模型的去中心化AI网络支持Llama-3

aiOS是 "hyperspaceai" 组织开发的世界首个基于 Mistral7B 模型的去中心化 AI 网络。它旨在彻底改变人工智能的可访问性，让用户能够体验到前沿的去中心化人工智能计算。目前该应用程序处于早期开发阶段，提供给 Windows、Linux 和 macOS 用户下载体验。目前已经支持Llama-3，用户可以免费体验。

2024年7月10号 8:55

1.1k

X AI发布Grok-1.5更新：性能显著提升支持128K上下文长度

["XAI发布了最新大型语言模型Grok-1.5更新","Grok-1.5在编码和数学相关任务中性能显著提升","支持处理长达128K标记的上下文，内存容量增加16倍","基于JAX、Rust和Kubernetes构建，提供灵活的基础设施","新功能将推动大型语言模型的发展，提供更丰富高效体验"]

2024年3月29号 11:19

420

AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度

["AI21发布了世界首个Mamba的生产级模型:Jamba，采用了SSM-Transformer架构，具有52B参数。","Jamba支持256K上下文长度，结合Joint Attention和Mamba技术，在处理长文本任务上效率提高3倍。","Jamba模型融合了SSM技术和Transformer架构，克服了各自的局限，保持高效率和性能。","MistralAI推出了Mistral7Bv0.2BaseModel，提升上下文到32K，取消滑动窗口，努力提供更优质的AI解决方案。","Cohere发布了Command-R，旨在实现生产规模人工智能，专注检索增强生成和工具使用，为企业提供扩展的生成模型。"]

2024年3月29号 11:18

450

Mistral 7B v0.2 基模型开源，支持 32K 上下文

["开源 Mistral7B v0.2Base Model，上下文提升至 32K","与微软达成合作协议，微软投资 1600 万美元","发布旗舰级大模型 Mistral Large，直接竞争 GPT-4","持续发展，超越传统竞争对手，推出新模型"]

2024年3月25号 11:02

410

模型上下文长度达到10000000，又一批创业者完蛋了？

["谷歌发布的Gemini 1.5 Pro模型，上下文长度达到1000万Token，引发了对RAG技术未来的讨论。","有人认为，长文本输入能够解决RAG需要解决的大部分问题，甚至会取代RAG。","也有人认为，RAG仍然会在未来发挥重要作用，因为长文本输入在成本和效率上仍然存在问题。","谷歌在算力方面的优势，使其在上下文长度的探索上领先于其他公司。","这篇文章预测，以Langchain 、LLaMA index这类框架作为技术栈的初创公司，会在2025年迎来终结。"]

2024年2月27号 10:08

360

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图