AV-HuBERT
Selbstüberwachtes Lernframework für audiovisuelle Sprachverarbeitung
Normales ProduktProgrammierungAudiovisuelle VerarbeitungSelbstüberwachtes Lernen
AV-HuBERT ist ein selbstüberwachtes Repräsentationslernframework, speziell für die audiovisuelle Sprachverarbeitung entwickelt. Es erreichte im LRS3-Benchmark für audiovisuelle Sprache State-of-the-Art-Ergebnisse in den Bereichen Lippelesen, automatische Spracherkennung (ASR) und audiovisuelle Spracherkennung. Das Framework lernt audiovisuelle Sprachrepräsentationen durch maskierte multimodal Cluster-Vorhersage und bietet eine robuste selbstüberwachte audiovisuelle Spracherkennung.
AV-HuBERT Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34