AV-HuBERT
音声・視覚音声処理のための自己教師あり学習フレームワーク
一般製品プログラミング音声・視覚処理自己教師あり学習
AV-HuBERTは、音声・視覚音声処理に特化した自己教師あり表現学習フレームワークです。LRS3音声・視覚音声ベンチマークテストにおいて、最先端のリップリーディング、自動音声認識(ASR)、および音声・視覚音声認識の結果を実現しています。このフレームワークは、マスキングされたマルチモーダルクラスタリング予測を通じて音声・視覚音声表現を学習し、堅牢な自己教師あり音声・視覚音声認識を提供します。
AV-HuBERT 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34