Large Concept Models
在句子表示空间中的语言建模
普通产品编程自然语言处理多语言
Large Concept Models(LCM)是由Facebook Research开发的一个大型语言模型,它在句子的表示空间中进行操作,使用SONAR嵌入空间支持多达200种语言的文本和57种语言的语音。LCM是一个序列到序列模型,用于自回归句子预测,探索了多种方法,包括均方误差回归、基于扩散的生成变体等。这些探索使用的是1.6B参数模型和约1.3T的培训数据。LCM的主要优点包括其在高级别语义表示上的运作能力,以及能够处理多语言数据的能力。此外,LCM的开源性质使得研究人员和开发者能够访问和使用这些模型,推动自然语言处理技术的发展。
Large Concept Models 最新流量情况
月总访问量
494758773
跳出率
37.69%
平均页面访问数
5.7
平均访问时长
00:06:29