Mini-Omni
Modelo de linguagem de grande porte multimodal de código aberto, com suporte para entrada de voz em tempo real e saída de áudio em streaming.
Produto ComumProdutividadeMultimodalReconhecimento de Voz
O Mini-Omni é um modelo de linguagem de grande porte multimodal de código aberto, capaz de realizar conversas com entrada de voz em tempo real e saída de áudio em streaming. Ele possui a funcionalidade de conversação de voz para voz em tempo real, sem necessidade de modelos ASR ou TTS adicionais. Além disso, ele pode gerar saída de voz enquanto pensa, suportando a geração simultânea de texto e áudio. O Mini-Omni aprimora ainda mais seu desempenho por meio de inferência em lote 'Audio-to-Text' e 'Audio-to-Audio'.
Mini-Omni Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34