据第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。图源备注:图片由AI生成,图片授权服务商Midjourney据知情人士透露,小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧,因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼,她拥有北京大学计算语言学研究所的硕士学位,并在自然语言处理领域的顶级会议 ACL2019上发表了
近日,Anthropic 发布了一份技术报告,基于对100万次 Claude 使用案例的分析,揭示了用户在使用 Claude 进行各种活动时的偏好和需求。为了保护用户隐私,Anthropic 运用了名为 Clio 的统计方法,通过将对话内容提炼为抽象的主题进行聚类,从而实现数据的匿名化和聚合。报告显示,Claude 在开发领域的应用尤为突出,开发相关的对话占据了所有对话的10% 以上,成为使用最广泛的类别。软件开发人员利用 Claude 执行从调试代码到解释 Git 操作的各种任务,充分体现了其在编码过程中的实用性。此外
英伟达(NVIDIA)近日发布了一款全新的紧凑型生成式AI超级计算机——Jetson Orin Nano Super开发者套件。这款产品不仅在性能上有了显著提升,价格也大幅降低,并可通过软件升级进一步提升性能,旨在让更多人拥抱生成式AI。这款全新的Jetson Orin Nano Super开发者套件体积小巧,可以轻松握在手中,它为商业AI开发者、爱好者和学生提供了更强大的生成式AI能力和更高的性能。其价格也从之前的499美元降至249美元,大幅降低了使用门槛。该套件今日正式上市,与上一代产品相比,其生成式AI推理性
大型语言模型 (LLM) 在自然语言处理 (NLP) 领域取得了显著进展,使其在文本生成、摘要和问答等应用中大放异彩。然而,LLM 对令牌级处理(一次预测一个词)的依赖也带来了一些挑战。这种方法与人类的交流方式形成对比,后者通常在更高层次的抽象层面运作,例如句子或想法。令牌级建模在需要长上下文理解的任务中也显得力不从心,并可能产生不一致的输出。此外,将这些模型扩展到多语言和多模态应用中,在计算上成本高昂,且需要大量数据。为了解决这些问题,Meta AI 的研究人员