Best AI Websites & Tools

AI製品ランキング

AI製品ランキング

AV-HuBERT

音声・視覚音声処理のための自己教師あり学習フレームワーク

一般製品プログラミング音声・視覚処理自己教師あり学習

ウェブサイトを開く

AV-HuBERTは、音声・視覚音声処理に特化した自己教師あり表現学習フレームワークです。LRS3音声・視覚音声ベンチマークテストにおいて、最先端のリップリーディング、自動音声認識（ASR）、および音声・視覚音声認識の結果を実現しています。このフレームワークは、マスキングされたマルチモーダルクラスタリング予測を通じて音声・視覚音声表現を学習し、堅牢な自己教師あり音声・視覚音声認識を提供します。

AV-HuBERT

音声・視覚音声表現学習
マスキングされたマルチモーダルクラスタリング予測
自己教師あり学習
リップリーディング、ASR、および音声・視覚音声認識

音声・視覚音声認識研究
自動音声認識システム開発
マルチモーダルデータクラスタリング分析

研究者はAV-HuBERTフレームワークを用いて音声・視覚音声認識の試験研究を実施しました。
開発者はAV-HuBERTモデルを利用して、様々な言語環境における音声認識アプリケーションを開発しました。
教育関係者はAV-HuBERTを用いて言語学習ツールを開発し、生徒の言語理解能力向上に役立てています。

ウェブサイトを開く

AV-HuBERT 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

AV-HuBERT 訪問数の傾向

AV-HuBERT 訪問地理的分布

AV-HuBERT トラフィックソース

AV-HuBERT 代替品

AV-HuBERT — 音声・視覚音声処理のための自己教師あり学習フレームワーク

プログラミング

•音声・視覚処理•自己教師あり学習

SHMT — 潜在拡散モデルに基づく自己教師あり階層的メイクアップ転移技術

•画像処理•自己教師あり学習

Sparsh — 視覚ベースの触覚センシングのための、自己教師あり触覚表現。

•自己教師あり学習•触覚センシング

Video-Foley — 動画と音声の同期生成システム

•動画音声合成•自己教師あり学習

HOI-Swap — ビデオ編集における手と物体のインタラクション認識

•ビデオ編集•手と物体のインタラクション

MimicBrush — ゼロショット画像編集。参考画像のスタイルをワンクリックで模倣

•画像編集•ゼロショット学習

DenseAV — 自己教師ありの視覚聴覚特徴アラインメントモデルです。

•自己教師あり学習•視覚聴覚アラインメント

AniTalker — 静止の肖像画と入力オーディオから、生き生きとしたアニメーション対話ビデオに変換します。

•アニメーション•表情

miqu-1-70b — Miqu 1-70bはオープンソースの大規模言語モデルです

•Transformer•GPT

視覚検査 — モデル間の文字列関係を学習し、視覚世界を検査する

•言語モデル•視覚