Mini-Omni

リアルタイム音声入力とストリーミング音声出力をサポートする、オープンソースのマルチモーダル大規模言語モデルです。

一般製品生産性マルチモーダル音声認識
Mini-Omniは、リアルタイムの音声入力とストリーミング音声出力による対話機能を実現する、オープンソースのマルチモーダル大規模言語モデルです。追加のASRやTTSモデルを必要とせずに、リアルタイムの音声対音声対話機能を備えています。さらに、思考しながら音声出力ができ、テキストと音声の同時生成をサポートします。Mini-Omniは、『Audio-to-Text』と『Audio-to-Audio』のバッチ推論によって性能をさらに向上させています。
ウェブサイトを開く

Mini-Omni 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

Mini-Omni 訪問数の傾向

Mini-Omni 訪問地理的分布

Mini-Omni トラフィックソース

Mini-Omni 代替品