近日,苹果公司在机器学习领域的最新研究显示,他们通过与 NVIDIA 的合作,成功将大型语言模型(LLM)的生成速度提高了近三倍。这一进展的关键在于苹果开源的技术 “Recurrent Drafter”(ReDrafter),它采用了一种推测解码方法,能够显著提升模型训练的效率。在过去,创建大型语言模型的过程通常非常耗时和耗资源,企业常常需要购买大量的硬件设备,进而增加了运营成本。2024年早些时候,苹果发布了 ReDrafter,这一技术结合了递归神经网络和动态树关注的方法,能够快速生成和验证标记,
开源AI模型管理工具Pinokio发布3.0版本,带来界面自定义、包管理优化和浏览器自动化等重要新功能,进一步简化了用户在本地部署和运行开源AI模型的流程。Pinokio 现在显示每个应用程序使用的磁盘空间量。此次更新的核心亮点包括:界面定制功能全面升级,用户现在可以通过CSS代码自由调整起始页、应用页面和终端的外观;包管理系统切换到UV作为Python的原生包管理器,提升了新包安装速度;新增磁盘空间占用显示功能,方便用户管理已安装应用;错误提示系统得到优化,取代了此前模糊的"ENO
阿布扎比技术创新研究院(TII)发布新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上的性能表现创下新纪录。这一训练规模是其前代产品Falcon2的两倍有余。Falcon3系列共推出四种规格:1B、3B、7B和10B,每种规格均提供基础版和针对对话优化的Instruct版本。尽管专门提供英语、法语、西班牙语和葡萄牙语版本,但各型号都能处理大多数常用语言。在Hugging Face的第三方语言模型评测中,Falcon3击败了包括Meta的Llama-3.1-8B、Qwen2.5-7B、Mistral的NeMo-12B和谷歌的Gemma2-9B在
据分析师迪伦・帕特尔(Dylan Patel)透露,微软可能会在 AI 公司 Anthropic 的新一轮融资中投资,后者是 Claude 模型的开发者。帕特尔在社交平台 X 上表示,若此次融资成功,Anthropic 的估值将提升至590亿美元。目前,Anthropic 的估值为184亿美元,去年11月,该公司刚通过亚马逊的领导融资获得40亿美元的资金。因此,短期内再次融资的可能性似乎不大。帕特尔指出,微软希望拥有 Claude 模型,以便能与 OpenAI 进行竞争。OpenAI 是微软的重要合作伙伴,微软迄今已向其投资超过130亿美元,这让业界对