AV-HuBERT

Marco de aprendizaje autosupervisado para el procesamiento de voz audio-visual.

Producto ComúnProgramaciónProcesamiento audio-visualAprendizaje autosupervisado
AV-HuBERT es un marco de aprendizaje de representación autosupervisado, específicamente diseñado para el procesamiento de voz audio-visual. Ha logrado resultados de vanguardia en lectura labial, reconocimiento automático del habla (ASR) y reconocimiento de voz audio-visual en el conjunto de datos de referencia LRS3. El marco aprende representaciones de voz audio-visual mediante la predicción de agrupaciones multimodales enmascaradas y proporciona un robusto reconocimiento de voz audio-visual autosupervisado.
Abrir sitio web

AV-HuBERT Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

AV-HuBERT Tendencia de visitas

AV-HuBERT Distribución geográfica de las visitas

AV-HuBERT Fuentes de tráfico

AV-HuBERT Alternativas