据第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。图源备注:图片由AI生成,图片授权服务商Midjourney据知情人士透露,小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧,因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼,她拥有北京大学计算语言学研究所的硕士学位,并在自然语言处理领域的顶级会议 ACL2019上发表了
开源AI模型管理工具Pinokio发布3.0版本,带来界面自定义、包管理优化和浏览器自动化等重要新功能,进一步简化了用户在本地部署和运行开源AI模型的流程。Pinokio 现在显示每个应用程序使用的磁盘空间量。此次更新的核心亮点包括:界面定制功能全面升级,用户现在可以通过CSS代码自由调整起始页、应用页面和终端的外观;包管理系统切换到UV作为Python的原生包管理器,提升了新包安装速度;新增磁盘空间占用显示功能,方便用户管理已安装应用;错误提示系统得到优化,取代了此前模糊的"ENO
阿布扎比技术创新研究院(TII)发布新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上的性能表现创下新纪录。这一训练规模是其前代产品Falcon2的两倍有余。Falcon3系列共推出四种规格:1B、3B、7B和10B,每种规格均提供基础版和针对对话优化的Instruct版本。尽管专门提供英语、法语、西班牙语和葡萄牙语版本,但各型号都能处理大多数常用语言。在Hugging Face的第三方语言模型评测中,Falcon3击败了包括Meta的Llama-3.1-8B、Qwen2.5-7B、Mistral的NeMo-12B和谷歌的Gemma2-9B在
阿联酋政府支持的技术创新研究所(TII)近日宣布推出其新一代开源小型语言模型(SLM)——Falcon3系列。这一系列包括四个不同规模的模型:1B、3B、7B和10B,并提供基础版与指令版两种变体,旨在为开发人员、研究人员和企业提供一种高效且成本低廉的AI解决方案。这些模型的推出,标志着AI功能的进一步民主化,能够在轻量级的单GPU基础设施上运行,满足对计算资源有限的设备和应用场景的需求。图源备注:图片由AI生成,图片授权服务商MidjourneyFalcon3的表现已在Hugging Face排行榜上脱颖而出,超