Mini-Omni

开源多模态大型语言模型,支持实时语音输入和流式音频输出。

普通产品生产力多模态语音识别
Mini-Omni是一个开源的多模态大型语言模型,能够实现实时的语音输入和流式音频输出的对话能力。它具备实时语音到语音的对话功能,无需额外的ASR或TTS模型。此外,它还可以在思考的同时进行语音输出,支持文本和音频的同时生成。Mini-Omni通过'Audio-to-Text'和'Audio-to-Audio'的批量推理进一步增强性能。
打开网站

Mini-Omni 最新流量情况

月总访问量

499904316

跳出率

37.31%

平均页面访问数

5.8

平均访问时长

00:06:52

Mini-Omni 访问量趋势

Mini-Omni 访问地理位置分布

Mini-Omni 流量来源

Mini-Omni 替代品