Mini-Omni
リアルタイム音声入力とストリーミング音声出力をサポートする、オープンソースのマルチモーダル大規模言語モデルです。
一般製品生産性マルチモーダル音声認識
Mini-Omniは、リアルタイムの音声入力とストリーミング音声出力による対話機能を実現する、オープンソースのマルチモーダル大規模言語モデルです。追加のASRやTTSモデルを必要とせずに、リアルタイムの音声対音声対話機能を備えています。さらに、思考しながら音声出力ができ、テキストと音声の同時生成をサポートします。Mini-Omniは、『Audio-to-Text』と『Audio-to-Audio』のバッチ推論によって性能をさらに向上させています。
Mini-Omni 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34