近日,UC伯克利研究者推出了大世界模型(LWM),与谷歌的Gemini 1.5 Pro在处理长视频和语言序列上能力相当。LWM通过RingAttention技术进行训练,支持处理超长文本和视频,表现优异。虽然Gemini 1.5和Sora等模型引发热议,但仍存在局限性,需要更多的研究和探索。