AV-HuBERT

Selbstüberwachtes Lernframework für audiovisuelle Sprachverarbeitung

Normales ProduktProgrammierungAudiovisuelle VerarbeitungSelbstüberwachtes Lernen
AV-HuBERT ist ein selbstüberwachtes Repräsentationslernframework, speziell für die audiovisuelle Sprachverarbeitung entwickelt. Es erreichte im LRS3-Benchmark für audiovisuelle Sprache State-of-the-Art-Ergebnisse in den Bereichen Lippelesen, automatische Spracherkennung (ASR) und audiovisuelle Spracherkennung. Das Framework lernt audiovisuelle Sprachrepräsentationen durch maskierte multimodal Cluster-Vorhersage und bietet eine robuste selbstüberwachte audiovisuelle Spracherkennung.
Website öffnen

AV-HuBERT Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

AV-HuBERT Besuchstrend

AV-HuBERT Geografische Verteilung der Besuche

AV-HuBERT Traffic-Quellen

AV-HuBERT Alternativen