AV-HuBERT

Estrutura de aprendizado autossupervisionado para processamento de fala áudio-visual.

Produto ComumProgramaçãoProcessamento áudio-visualAprendizado autossupervisionado
AV-HuBERT é uma estrutura de aprendizado de representação autossupervisionada, especializada no processamento de fala áudio-visual. Alcançou resultados de ponta em leitura labial, reconhecimento automático de fala (ASR) e reconhecimento de fala áudio-visual no benchmark de fala áudio-visual LRS3. A estrutura aprende representações de fala áudio-visual por meio da previsão de agrupamento multimodal mascarado e fornece um reconhecimento de fala áudio-visual autossupervisionado robusto.
Abrir Site

AV-HuBERT Situação do Tráfego Mais Recente

Total de Visitas Mensais

474564576

Taxa de Rejeição

36.20%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:34

AV-HuBERT Tendência de Visitas

AV-HuBERT Distribuição Geográfica das Visitas

AV-HuBERT Fontes de Tráfego

AV-HuBERT Alternativas