近日,苹果公司在机器学习领域的最新研究显示,他们通过与 NVIDIA 的合作,成功将大型语言模型(LLM)的生成速度提高了近三倍。这一进展的关键在于苹果开源的技术 “Recurrent Drafter”(ReDrafter),它采用了一种推测解码方法,能够显著提升模型训练的效率。在过去,创建大型语言模型的过程通常非常耗时和耗资源,企业常常需要购买大量的硬件设备,进而增加了运营成本。2024年早些时候,苹果发布了 ReDrafter,这一技术结合了递归神经网络和动态树关注的方法,能够快速生成和验证标记,
开源AI模型管理工具Pinokio发布3.0版本,带来界面自定义、包管理优化和浏览器自动化等重要新功能,进一步简化了用户在本地部署和运行开源AI模型的流程。Pinokio 现在显示每个应用程序使用的磁盘空间量。此次更新的核心亮点包括:界面定制功能全面升级,用户现在可以通过CSS代码自由调整起始页、应用页面和终端的外观;包管理系统切换到UV作为Python的原生包管理器,提升了新包安装速度;新增磁盘空间占用显示功能,方便用户管理已安装应用;错误提示系统得到优化,取代了此前模糊的"ENO
阿布扎比技术创新研究院(TII)发布新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上的性能表现创下新纪录。这一训练规模是其前代产品Falcon2的两倍有余。Falcon3系列共推出四种规格:1B、3B、7B和10B,每种规格均提供基础版和针对对话优化的Instruct版本。尽管专门提供英语、法语、西班牙语和葡萄牙语版本,但各型号都能处理大多数常用语言。在Hugging Face的第三方语言模型评测中,Falcon3击败了包括Meta的Llama-3.1-8B、Qwen2.5-7B、Mistral的NeMo-12B和谷歌的Gemma2-9B在
据路透社援引三位知情人士的消息,苹果公司正在与腾讯和字节跳动展开谈判,探讨将这两家中国公司的人工智能(AI)模型整合至中国市场销售的iPhone中。这一举措是苹果AI系统Apple Intelligence的一部分,而从本月开始,苹果已在全球市场的iPhone中整合了ChatGPT聊天机器人功能。图源备注:图片由AI生成,图片授权服务商Midjourney知情人士透露,苹果与腾讯和字节跳动的讨论主要涉及利用后两者的AI模型。这一谈判目前尚处于早期阶段,细节仍未敲定。值得注意的是,此前有媒体曾报道,苹果曾