AV-HuBERT

Framework d'apprentissage autosupervisé pour le traitement audio-visuel de la parole

Produit OrdinaireProgrammationTraitement audio-visuelApprentissage autosupervisé
AV-HuBERT est un framework d'apprentissage de représentations autosupervisé, spécialement conçu pour le traitement audio-visuel de la parole. Il a atteint des résultats de pointe en lecture labiale, en reconnaissance automatique de la parole (ASR) et en reconnaissance audio-visuelle de la parole lors des tests de référence LRS3. Ce framework apprend des représentations audio-visuelles de la parole grâce à la prédiction de clustering multi-modal masqué, et offre une reconnaissance audio-visuelle de la parole autosupervisée robuste.
Ouvrir le site Web

AV-HuBERT Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

AV-HuBERT Tendance des visites

AV-HuBERT Distribution géographique des visites

AV-HuBERT Sources de trafic