国内首批大模型的行业落地进展浮出水面,落地预期回归理性,开源大模型给市场界格局带来变数。大模型在能源、金融、医药等行业中初步展示了潜力和改变。企业纷纷涌向开源大模型,大厂们也调整策略,左手闭源,右手开源。
据第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。图源备注:图片由AI生成,图片授权服务商Midjourney据知情人士透露,小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧,因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼,她拥有北京大学计算语言学研究所的硕士学位,并在自然语言处理领域的顶级会议 ACL2019上发表了
在人工智能迅速发展的时代,大型模型的智能化水平不断提升,但随之而来的推理系统效率挑战也越来越明显。如何应对高推理负载、降低推理成本、缩短响应时间,已成为业界共同面对的重要问题。Kimi 公司联合清华大学的 MADSys 实验室,推出了基于 KVCache 的 Mooncake 推理系统设计方案,该方案于2024年6月正式发布。Mooncake 推理系统通过创新的 PD 分离架构和以存换算为中心的理念,显著提升了推理的吞吐能力,吸引了广泛的行业关注。为了进一步推动这一技术框架的应用与普及,Kimi 与清华
视觉AI开发平台Roboflow近日宣布完成4000万美元B轮融资。本轮融资由GV领投,Craft Ventures、Y Combinator以及Vercel AI创始人Guillermo Rauch、谷歌高管Jeff Dean和Replit创始人Amjad Masad等知名投资者参投。作为一站式视觉AI开发平台,Roboflow正在重新定义计算机视觉模型的开发方式。从最初的图像集管理工具起步,如今已发展成为一个全方位的解决方案,涵盖从原始图像和视频数据到生产就绪的视觉AI应用的完整开发流程。平台提供了一系列强大功能,包括数据集理解、自动数据标注、模型训练、微调和部署
2024年云栖大会在杭州盛大开幕,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在会上发表了主题演讲。大会期间,阿里巴巴宣布了一系列重磅硬核发布,包括通义千问新一代开源模型Qwen2.5的推出,该模型在性能上超越了Llama405B,稳居“最强开源大模型”的位置。