EMOVA
情感丰富的多模态语言模型
普通产品其他多模态语音识别
EMOVA(EMotionally Omni-present Voice Assistant)是一个多模态语言模型,它能够进行端到端的语音处理,同时保持领先的视觉-语言性能。该模型通过语义-声学解耦的语音分词器,实现了情感丰富的多模态对话,并在视觉-语言和语音基准测试中达到了最先进的性能。
EMOVA 最新流量情况
月总访问量
1153
跳出率
59.77%
平均页面访问数
1.0
平均访问时长
00:00:00
情感丰富的多模态语言模型
月总访问量
1153
跳出率
59.77%
平均页面访问数
1.0
平均访问时长
00:00:00