LSLM
リアルタイム音声インタラクションを備えたAI対話システム。
一般製品チャット人工知能音声認識
Listening-while-Speaking Language Model (LSLM)は、人間と機械のインタラクションの自然さを向上させることを目的としたAI対話モデルです。全二重モデル化(FDM)技術により、話しながら同時に音声を受信する能力を実現し、リアルタイムインタラクションを強化します。特に、生成された内容に満足できない場合でも、中断してリアルタイムで応答できます。LSLMは、トークンベースのデコーダによるTTSのみを用いた音声生成と、ストリーミング自己教師あり学習(SSL)エンコーダによるリアルタイムオーディオ入力を使用し、3種類の融合戦略(早期融合、中期融合、後期融合)を通じて最適なインタラクションバランスを探ります。
LSLM 最新のトラフィック状況
月間総訪問数
158
直帰率
45.09%
平均ページ/訪問
1.0
平均訪問時間
00:00:00