AV-HuBERT

音声・視覚音声処理のための自己教師あり学習フレームワーク

一般製品プログラミング音声・視覚処理自己教師あり学習
AV-HuBERTは、音声・視覚音声処理に特化した自己教師あり表現学習フレームワークです。LRS3音声・視覚音声ベンチマークテストにおいて、最先端のリップリーディング、自動音声認識(ASR)、および音声・視覚音声認識の結果を実現しています。このフレームワークは、マスキングされたマルチモーダルクラスタリング予測を通じて音声・視覚音声表現を学習し、堅牢な自己教師あり音声・視覚音声認識を提供します。
ウェブサイトを開く

AV-HuBERT 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

AV-HuBERT 訪問数の傾向

AV-HuBERT 訪問地理的分布

AV-HuBERT トラフィックソース

AV-HuBERT 代替品