国内首批大模型的行业落地进展浮出水面,落地预期回归理性,开源大模型给市场界格局带来变数。大模型在能源、金融、医药等行业中初步展示了潜力和改变。企业纷纷涌向开源大模型,大厂们也调整策略,左手闭源,右手开源。
视觉AI开发平台Roboflow近日宣布完成4000万美元B轮融资。本轮融资由GV领投,Craft Ventures、Y Combinator以及Vercel AI创始人Guillermo Rauch、谷歌高管Jeff Dean和Replit创始人Amjad Masad等知名投资者参投。作为一站式视觉AI开发平台,Roboflow正在重新定义计算机视觉模型的开发方式。从最初的图像集管理工具起步,如今已发展成为一个全方位的解决方案,涵盖从原始图像和视频数据到生产就绪的视觉AI应用的完整开发流程。平台提供了一系列强大功能,包括数据集理解、自动数据标注、模型训练、微调和部署
2024年云栖大会在杭州盛大开幕,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在会上发表了主题演讲。大会期间,阿里巴巴宣布了一系列重磅硬核发布,包括通义千问新一代开源模型Qwen2.5的推出,该模型在性能上超越了Llama405B,稳居“最强开源大模型”的位置。
深圳元象信息科技有限公司近日宣布,公司已成功发布中国最大的Mixture of Experts(MoE)开源大模型——XVERSE-MoE-A36B。这款模型的发布标志着中国在AI领域的一大进步,将国产开源技术提升至国际领先水平。
在游戏开发领域,大模型逐渐成为不可或缺的“智囊团”,从AI角色生成到场景构建,展现全面能力。然而,游戏场景理解、图像识别与内容描述仍需提升。加拿大阿尔伯塔的研究团队推出开源大模型VideoGameBunny(VGB),针对游戏开发优化,具备多语言支持、高度可定制性、强大的文本生成能力、开源易访问性、兼容多种开发环境、丰富的模型文件和活跃社区支持。VGB支持多种功能,如游戏对话系统、教育应用、客服聊天机器人等。其核心组件Bunny模型,通过多层感知器网络将视觉信息转换为图像标记,高效处理游戏数据。通过与Meta开源LLama-3-8B结合使用SigLIP视觉编码器和S2包装器,VGB能够捕捉游戏视觉内容的多尺度特征,理解游戏环境,并生成匹配游戏图像的指令数据,如简短和详细的标题、图像到JSON的描述及基于图像的问答,从而提升游戏的互动性和沉浸感,成为开发者和玩家的强大助手。