LSLM
Sistema de diálogo de inteligência artificial com interação de voz em tempo real.
Produto ComumChatInteligência ArtificialReconhecimento de Voz
O Modelo de Linguagem de Escuta Simultânea (Listening-while-Speaking Language Model - LSLM) é um modelo de diálogo de inteligência artificial projetado para melhorar a naturalidade da interação humano-computador. Por meio da tecnologia de modelagem full-duplex (FDM), ele permite a capacidade de ouvir enquanto fala, melhorando a interação em tempo real, especialmente a capacidade de ser interrompido e responder em tempo real quando o conteúdo gerado não é satisfatório. O LSLM emprega um decodificador baseado em tokens com geração de voz apenas por TTS e um codificador de aprendizado autossupervisionado em fluxo (SSL) para entrada de áudio em tempo real, explorando três estratégias de fusão (fusão precoce, fusão intermediária e fusão tardia) para buscar o melhor equilíbrio de interação.
LSLM Situação do Tráfego Mais Recente
Total de Visitas Mensais
158
Taxa de Rejeição
45.09%
Média de Páginas por Visita
1.0
Duração Média da Visita
00:00:00