阿里云百炼上线通义千问百万长文本模型Qwen2.5-Turbo

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月21号 8:28

200

阿里云百炼平台近日宣布上线了Qwen2.5-Turbo百万长文本模型，Qwen2.5-Turbo模型由通义千问团队开发，支持处理高达100万tokens的超长上下文，相当于100万个英文单词或150万个汉字。

这一新版本的模型在长文本检索任务中的准确率达到100%，并在长文本评测集RULER上获得93.1分，超越了GPT-4。在LV-Eval、LongBench-Chat等接近真实场景的长文本任务中，Qwen2.5-Turbo在多数维度上超越了GPT-4o-mini。在短文本基准测试中，Qwen2.5-Turbo的表现也非常出色，显著超越了之前上下文长度为1M tokens的开源模型。

微信截图_20241121082702.png

Qwen2.5-Turbo模型的应用场景广泛，包括长篇小说深入理解、大规模代码助手、多篇论文阅读等，能够一次性处理10本长篇小说、150小时的演讲稿或3万行代码。在推理速度方面，通义千问团队通过稀疏注意力机制将计算量压缩了约12.5倍，将处理1M tokens上下文的首字返回时间从4.9分钟降低到68秒，实现了4.3倍的速度提升。

阿里云百炼平台为所有用户提供了直接调用Qwen2.5-Turbo API的能力，并限时赠送1000万tokens额度。后续使用百万tokens的成本仅为0.3元。

目前，阿里云百炼平台已上线包括Qwen、Llama、ChatGLM在内的超200款国内外主流开源和闭源大模型，支持用户直接调用、训练微调或打造RAG应用。

阿里云魔搭首发上线阶跃星辰最新开源的两款多模态模型

全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会（GDC）上，阿里云魔搭社区重磅宣布，首发上线阶跃星辰最新开源的两款多模态模型，包括全球参数量最大的开源视频生成模型 Step-Video-T2V，以及业界首款产品级开源语音交互模型 Step-Audio。这一消息瞬间引爆全球AI开源社区，再次彰显中国在人工智能领域的强劲创新实力。作为中国最大的AI模型社区，阿里云魔搭社区此次发布的这两款重磅模型，无疑是近期全球多模态领域最受瞩目的开源成果。 Step-Video-T2V 以其巨大的参数规模

通义灵码上线模型选择功能新增支持 DeepSeek-V3、R1 模型

2月12日，阿里云百炼平台推出多款重磅AI模型，包括DeepSeek-V3、DeepSeek-R1以及DeepSeek-R1-Distill-Qwen-32B等6款模型，进一步丰富了其AI模型矩阵。与此同时，通义灵码也宣布全新上线模型选择功能，支持基于百炼平台的DeepSeek-V3和DeepSeek-R1满血版671B模型，为AI编程领域注入了新的活力。

阿里巴巴携手苹果开发中国iPhone AI功能，通义千问或引领行业变革

近期有消息称，阿里巴巴将与苹果公司合作，致力于为中国市场的 iPhone 用户开发全新的人工智能功能。这一举措被视为苹果应对在中国市场销售下滑的重要策略，目的是为用户提供更加吸引人的软件体验。知情人士透露，苹果自2023年开始便在测试多种来自中国知名人工智能开发者的不同 AI 模型。在经过一系列评估后，苹果去年与百度达成合作，成为其主要的 AI 技术供应商。然而，随着市场环境的变化，苹果在最近几个月开始重新考虑其选择，评估腾讯、字节跳动、阿里巴巴以及 Deepseek

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

近日，全球最大人工智能开源社区 Huggingface 发布了最新的开源大模型排行榜（Open LLM Leaderboard），结果显示，排名前十的开源大模型全都是基于阿里通义千问(Qwen)开源模型进行二次训练的衍生模型。这一成就标志着 Qwen 在开源 AI 领域的主导地位，进一步推动了其在全球的影响力。Open LLM Leaderboard 被广泛认为是当前最权威的开源大模型榜单，测试维度涵盖了多个领域，包括阅读理解、逻辑推理、数学计算及事实问答等。令人惊讶的是，通义千问 Qwen 已经发展成为全球最大的开源模型族群，其

AI新闻资讯