AV-HuBERT
Marco de aprendizaje autosupervisado para el procesamiento de voz audio-visual.
Producto ComúnProgramaciónProcesamiento audio-visualAprendizaje autosupervisado
AV-HuBERT es un marco de aprendizaje de representación autosupervisado, específicamente diseñado para el procesamiento de voz audio-visual. Ha logrado resultados de vanguardia en lectura labial, reconocimiento automático del habla (ASR) y reconocimiento de voz audio-visual en el conjunto de datos de referencia LRS3. El marco aprende representaciones de voz audio-visual mediante la predicción de agrupaciones multimodales enmascaradas y proporciona un robusto reconocimiento de voz audio-visual autosupervisado.
AV-HuBERT Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34