Meta发布超轻量Llama模型在手机 AI 竞赛中击败谷歌和苹果

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月25号 11:31

171

Meta Platforms今日发布其Llama模型的全新精简版本，包括Llama3.21B和3B两款产品，首次实现了大规模语言模型在普通智能手机和平板电脑上的稳定运行。通过创新性地整合量化训练技术与优化算法，新版本在保持原有处理质量的同时，将文件体积缩减56%，运行内存需求降低41%，处理速度更是提升至原版4倍，单次可连续处理8，000字符文本。

在 Android 手机上进行测试时，Meta 的压缩 AI 模型（SpinQuant 和 QLoRA）与标准版本相比，速度和效率都有显著提升。较小的模型运行速度提高了四倍，而内存占用却减少了

在OnePlus12手机的实际测试中，这款压缩版本展现出与标准版本相当的性能表现，同时大幅提升了运行效率，有效解决了移动设备算力不足的长期困扰。Meta选择采取开放合作的市场策略，与高通、联发科等主流移动处理器制造商展开深度合作，新版本将通过Llama官方网站和Hugging Face平台同步发布，为开发者提供便捷的接入渠道。

这一策略与行业其他巨头形成鲜明对比。当谷歌和苹果选择将新技术与其操作系统深度整合时，Meta的开放路线为开发者提供了更大的创新空间。此次发布标志着数据处理模式正从集中式服务器向个人终端转变，本地处理方案不仅能更好地保护用户隐私，还能提供更快捷的响应体验。

这项技术突破可能引发如同个人电脑普及时期的重大变革，尽管仍面临设备性能要求、开发者平台选择等挑战。随着移动设备性能的持续提升，本地化处理方案的优势将逐步显现。Meta期望通过开放合作的方式，推动整个行业向更高效、更安全的方向发展，为移动设备的未来应用开发开辟新途径。

Meta 宣布举办首届生成式 AI 开发者大会 LlamaCon，聚焦 Llama 系列模型

Meta 公司近日宣布，将于4月29日举行首届 LlamaCon 开发者大会，专注于其 Llama 系列生成式 AI 模型的最新进展。这一大会旨在为开发者提供一个平台，分享开源 AI 的最新成果，帮助他们更好地构建应用和产品。随着生成式 AI 技术的迅猛发展，Meta 希望通过此次大会进一步推动其生态系统的建设。在这场即将到来的大会上，Meta 计划展示多项与 Llama 模型相关的新功能和技术进展。Llama 模型自推出以来下载量已达数亿次，已经吸引了至少25个合作伙伴进行托管，显示出其在行业中的广泛应用。Met

日本AI专家评DeepSeek:中国AI新星崛起，技术实力接近OpenAI

中国初创企业DeepSeek（深度求索）开发的高性能、低成本生成式AI大规模语言模型(LLM)近日引发全球关注。日本AI研究领域的权威、东京大学教授松尾丰在接受日本经济新闻采访时，对DeepSeek的技术水平、开源战略及其对日本企业的影响进行了深入分析。松尾丰表示，DeepSeek的技术非常出色，其性能与美国OpenAI开发的ChatGPT接近。他指出，DeepSeek每次发布新模型时都会发布详细的技术论文，展示其在模型优化方面的创新之处。例如，今年1月发布的最新模型“R1”通过强化学习提升了推理能力，

大模型新突破：从教学视频中提炼高质量多模态教科书

近日，浙江大学与阿里巴巴达摩院联合发布了一项引人瞩目的研究，旨在通过教学视频创建高质量的多模态教科书。这一创新的研究成果不仅为大规模语言模型（VLMs）的训练提供了新的思路，也可能改变教育资源的利用方式。随着人工智能技术的迅猛发展，VLMs 的预训练语料主要依赖图文对数据与图文交织语料。然而，当前的这些数据多来自网页，文本与图像的关联性较弱，知识密度也相对较低，无法有效支持复杂的视觉推理。为了应对这一挑战，研究团队决定从互联网上海量的教学视频

腾讯混元发布浮点量化训练新理论，揭示大模型训练的极限

在大模型（Large Language Model，LLM）快速发展的今天，模型的训练和推理成本日益成为研究和应用的关注焦点。最近，腾讯混元团队发布了一项重要研究，深入探讨了低比特浮点量化训练的 “Scaling Laws”，即浮点数量化训练的规模法则。此项研究的核心在于通过降低模型的精度，探索如何在不损失性能的情况下，显著降低计算和存储成本。研究团队进行了多达366组不同参数规模和精度的浮点数量化训练，系统分析了影响训练效果的多种因素，包括模型大小（N）、训练数据量(D)、指数位(E)、尾

AI新闻资讯