AV-HuBERT
Framework d'apprentissage autosupervisé pour le traitement audio-visuel de la parole
Produit OrdinaireProgrammationTraitement audio-visuelApprentissage autosupervisé
AV-HuBERT est un framework d'apprentissage de représentations autosupervisé, spécialement conçu pour le traitement audio-visuel de la parole. Il a atteint des résultats de pointe en lecture labiale, en reconnaissance automatique de la parole (ASR) et en reconnaissance audio-visuelle de la parole lors des tests de référence LRS3. Ce framework apprend des représentations audio-visuelles de la parole grâce à la prédiction de clustering multi-modal masqué, et offre une reconnaissance audio-visuelle de la parole autosupervisée robuste.
AV-HuBERT Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34