昆仑万维：多模态大模型已进入实验性训练阶段

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · 2023年8月31号 16:27

昆仑万维表示其多模态大模型 “天工” 已进入实验性训练阶段，经过持续的迭代和高负荷的运行。手机端天工 AI 助手已上线内测，用户可进行万字以上的文本对话交互。

效果最佳！阶跃星辰开源Step-Video-T2V 视频生成模型

今日，阶跃星辰与吉利汽车集团宣布，联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。其中，阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。该模型拥有300亿参数量，能够直接生成204帧、540P分辨率的高质量视频，确保生成内容信息密度高、一致性强。评测结果显示，Step-Video-T2V在指令遵循、运动平滑性、物理合理性、美感度等方面均表现出色，显著超越市面上既有的最佳开源视频模型。

昆仑万维发布Matrix-Zero世界模型：国内首创3D场景与可交互视频生成

昆仑万维今日宣布正式推出其Matrix-Zero世界模型，成为国内首家同时具备3D场景生成和可交互视频生成能力的人工智能企业，标志着其在空间智能领域迈出了重要一步。Matrix-Zero的核心亮点在于其强大的3D场景生成功能。该功能可以将用户输入的图片转化为具有全局一致性、可自由探索的真实3D场景。这一突破性技术具备以下几个关键特性:全局一致性: Matrix-Zero生成的3D场景具有高度的全局一致性。例如，输入一张“城堡花园一角”的图片，模型可以生成一个360度环视后场景保持不变的3D环境，

昆仑万维发布Matrix-Zero世界模型支持3D场景、可交互视频生成

2025年2月14日，昆仑万维集团正式推出Matrix-Zero世界模型，标志着中国在空间智能领域迈出了重要一步。Matrix-Zero包含两款子模型:3D场景生成大模型和可交互视频生成大模型，旨在通过AI技术重塑数字内容创作模式，推动影视制作、游戏开发、具身智能等行业的创新发展。