zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2025-03-07 10:52:19
.
AIbase
.
16.1k
DeepSeek的MLA架构:大模型迁移的新突破
在人工智能领域,DeepSeek-R1的推出引发了广泛关注,这一创新代表了 AI 产业的颠覆性进展。其多头潜在注意力网络(Multi-head Latent Attention,MLA)架构,借助低秩压缩技术显著降低了训练与推理的成本,甚至仅为同等性能大模型的十分之一。这一成果由复旦大学 NLP 实验室的博士后纪焘及其团队共同完成,目标是让任意预训练的大语言模型能够快速迁移到 MLA 架构,而无需重新从头开始训练。目前,主流大模型普遍基于标准的多头注意力机制(MHA)及其变种,这些模型在推理成本上相较于 MLA
2025-02-24 10:18:41
.
AIbase
.
15.6k
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。FlashMLA的核心技术特性包括对BF16精度的全面支持,以及采用块大小为64的页式键值缓存(Paged KV Cache)系统,实现更精确的内存管理。在性能表现方面,基于CUDA12.6平台,FlashMLA在H800SXM5GPU上创下了显著成绩:在内存受限场景下达到3000GB/s的处理速度,在计算受限场景下则实现580TFLOPS的算力
2025-02-08 17:57:14
.
AIbase
.
15.2k
七彩虹推出 “虹光 AI” 助手接入全速版 DeepSeek
七彩虹科技正式宣布,其全新的 “虹光 AI” 智能模型助手已全面接入满血版 DeepSeek R1模型。这一升级使得七彩虹的笔记本产品在性能和推理效率上得到了显著提升。此次更新的 “虹光 AI” 助手,基于当前热门的 Transformer 架构,并采用了 MLA 与 Deep Seek MoE 技术,显著降低了内存占用,减少了缓存需求,从而提升了整体的推理效率。据了解,Deep Seek MoE 技术通过引入辅助损失来实现负载的智能平衡,这不仅优化了模型性能,还使得用户在使用过程中能够享受到更快速的响应体验。这一系列技
2024-10-23 09:47:50
.
AIbase
.
12.7k
Canva推出全新文生图工具Dream Lab,一键生成 3D 插图!
日前,Canva 推出了一系列全新的 AI 功能,其中最引人注目的要数它的新图像生成工具 ——“Dream Lab”。这个工具是 Canva 收购了生成 AI 初创公司 Leonardo.ai 后推出的,利用了 Leonardo 的 Phoenix 模型(别和 Adobe 的 Firefly AI 搞混了哦)。用户现在可以通过描述来生成各种风格的图像,比如 “3D 渲染” 和 “插图”。在此之前,Canva 已经拥有基于 Stable Diffusion 的 AI 图像生成器,并且还支持多个第三方应用。但这次的 Dream Lab 带来了许多改进,尤其在摄影风格和多主题图像的生成上表现得更好。而且