AV-HuBERT

自监督学习框架,用于音视觉语音处理

普通产品编程音视觉处理自监督学习
AV-HuBERT是一个自监督表示学习框架,专门用于音视觉语音处理。它在LRS3音视觉语音基准测试中实现了最先进的唇读、自动语音识别(ASR)和音视觉语音识别结果。该框架通过掩蔽多模态聚类预测来学习音视觉语音表示,并且提供了鲁棒的自监督音视觉语音识别。
打开网站

AV-HuBERT 最新流量情况

月总访问量

499904316

跳出率

37.31%

平均页面访问数

5.8

平均访问时长

00:06:52

AV-HuBERT 访问量趋势

AV-HuBERT 访问地理位置分布

AV-HuBERT 流量来源