有“AI教母”之称的斯坦福大学教授李飞飞及其团队近日发布了一项关于多模态大模型“空间智能”的研究,揭示这些模型在记忆和回忆空间方面已经具备初步能力,并展现出形成局部世界模型的潜力。研究团队开发了用于评估视觉空间智能能力的工具——VSI-Bench,其中包含超过5000个基于288个真实视频的高质量问答对。测试视频涵盖居住空间、专业场所及工业场景,涉及多个地理区域。研究结果显示,尽管多模态模型的总体表现尚低于人类,但在某些任务上已达到或接近人类水平。例如,
据智能涌现消息,中国大模型独角兽阶跃星辰近日完成数亿美元B轮融资,核心投资方包括上海国有资本投资有限公司及旗下基金,腾讯投资、五源资本、启明创投等战略和财务投资人也参与其中。这笔资金将主要用于基础模型研发,进一步提升多模态和复杂推理能力,并拓展C端应用场景。作为国内大模型“六小虎”之一,阶跃星辰以技术扎实和高效产出著称。其自研的Step系列模型涵盖语言、图像、视频及语音等多种模态,并在多个权威榜单上名列前茅。例如,在LiveBench和LMSYS Chatbot Arena的
近日,视觉中国宣布与北京生数科技有限公司建立战略合作关系,双方将共同探索并建立“视觉产业大模型平台及应用”。这一合作致力于深化人工智能技术在视觉内容产业的应用,并推动产业智能化升级,旨在为全球视觉内容创作者和使用者提供更高效、智能的服务。
近日,上海 AI 实验室宣布推出书生·万象InternVL2.5模型。这款开源多模态大型语言模型以其卓越的性能,成为首个在多模态理解基准(MMMU)上超过70%准确率的开源模型,与商业模型如GPT-4o和Claude-3.5-Sonnet等的性能相媲美。