国内大模型独角兽企业阶跃星辰近日宣布完成B轮融资,总金额高达数亿美元,引发行业高度关注。本轮融资吸引了众多重量级投资方的参与,包括上海国有资本投资有限公司及其旗下基金领投,腾讯投资、五源资本、启明创投等知名机构跟投。这笔巨额资金将主要用于加速基础模型的研发,重点提升多模态和复杂推理能力,并进一步拓展C端应用市场。阶跃星辰的CEO姜大昕表示,公司的发展路线与OpenAI的“ChatGPT到Sora”路径类似,都是致力于从单模态到多模态,再到实现多模理解和生成的统
有“AI教母”之称的斯坦福大学教授李飞飞及其团队近日发布了一项关于多模态大模型“空间智能”的研究,揭示这些模型在记忆和回忆空间方面已经具备初步能力,并展现出形成局部世界模型的潜力。研究团队开发了用于评估视觉空间智能能力的工具——VSI-Bench,其中包含超过5000个基于288个真实视频的高质量问答对。测试视频涵盖居住空间、专业场所及工业场景,涉及多个地理区域。研究结果显示,尽管多模态模型的总体表现尚低于人类,但在某些任务上已达到或接近人类水平。例如,
据智能涌现消息,中国大模型独角兽阶跃星辰近日完成数亿美元B轮融资,核心投资方包括上海国有资本投资有限公司及旗下基金,腾讯投资、五源资本、启明创投等战略和财务投资人也参与其中。这笔资金将主要用于基础模型研发,进一步提升多模态和复杂推理能力,并拓展C端应用场景。作为国内大模型“六小虎”之一,阶跃星辰以技术扎实和高效产出著称。其自研的Step系列模型涵盖语言、图像、视频及语音等多种模态,并在多个权威榜单上名列前茅。例如,在LiveBench和LMSYS Chatbot Arena的
阿里云百炼大模型服务平台最近推出了“音视频实时互动”功能,使用户能够轻松搭建多模态AI应用,无需编程知识。这一新功能使得用户可以快速将AI模型集成到Web、iOS和Android应用中,并与他人分享。用户可以通过简单的步骤来搭建智能体应用:首先新建智能体应用,然后在阿里云百炼平台上选择并配置所需的文本、语音或视觉理解大模型。平台提供了200多种大模型,包括具备强大视觉智能体能力的阿里云Qwen2-VL大模型。接下来,用户需要编写提示词,设置音视频API-KEY,并发布自己的专属AI应用。