Na China, na área de “IA + Social”, o Soul App está prestes a injetar nova vitalidade usando IA!
Recentemente, a Soul anunciou que seu modelo de linguagem de voz foi atualizado novamente, lançando um modelo de conversação de voz full-duplex ponta a ponta desenvolvido internamente.
O efeito mais impressionante dessa atualização é que permite que conversas de voz entre usuários e personagens virtuais sejam tão naturais e fluidas quanto conversas com pessoas reais!
Para ter uma ideia da realidade do efeito, assista ao vídeo abaixo:
Exemplo oficial de “experiência de chamada em tempo real com IA”
Então, o que há de tão especial no modelo de conversação de voz ponta a ponta desenvolvido internamente pela Soul?
De acordo com a descrição oficial, seus principais destaques incluem:
Latência de interação ultrabaixa
Interrupção automática rápida
Expressão vocal super realista
Capacidade de compreensão e percepção de emoções
A capacidade de latência de interação ultrabaixa significa que, no instante em que você fala, a IA reage imediatamente, sem nenhum atraso, aproximando-o instantaneamente da IA. Para ter uma interação real, não há necessidade de esperar, é como conversar com uma pessoa real.
O modelo de linguagem de voz da Soul suporta a função de interrupção automática rápida. Ou seja, quando você está conversando com a IA, se quiser interromper, ela entende perfeitamente e interrompe facilmente, tornando a interação muito mais divertida!
Finalmente, com a expressão vocal super realista e a capacidade de compreensão e percepção de emoções, a IA não apenas entende o que você diz, mas também percebe suas emoções e responde adequadamente.
Combinando o exemplo de vídeo oficial, se esse recurso for lançado totalmente no futuro, provavelmente muitos usuários do Soul não conseguirão distinguir entre pessoas reais e personagens virtuais de IA.
A Soul afirma que seu modelo de conversação de voz ponta a ponta já está sendo usado no cenário de conversação em tempo real “Ecos de Outro Mundo” (em fase de teste interno) e será expandido posteriormente para vários cenários de companhia e interação com IA, como o “AI Gou Dan”.
Segundo informações, em 2020, a Soul já havia iniciado o desenvolvimento de tecnologia AIGC, focando no desenvolvimento de tecnologias-chave como diálogo inteligente, tecnologia de voz e personagens virtuais, e integrando essas capacidades de IA profundamente em cenários sociais.
No processo de atualização social com IA, a Soul dá especial atenção à realização de uma experiência de companhia emocional humanizada e natural.
Para oferecer aos usuários melhor feedback emocional e sensação de companhia, a equipe técnica da Soul sempre se preocupou com a compreensão de emoções e problemas de latência. Eles lançaram modelos de linguagem de voz, modelos de reconhecimento de voz, modelos de diálogo de voz e modelos de geração de música desenvolvidos internamente, suportando geração de tons de voz reais, DIY de voz, troca de idiomas, diálogo em tempo real com várias emoções e simulação de pessoas reais, recursos que já são usados em vários cenários do Soul, como “AI Gou Dan”, interação de voz em tempo real de IA em “Lobo Homem Fantasma” e “Ecos de Outro Mundo”.
O lançamento do modelo de conversação de voz ponta a ponta desenvolvido internamente pela Soul significa que os usuários podem desfrutar de uma experiência de interação homem-máquina mais natural. No futuro, a Soul planeja promover ainda mais a construção de capacidades de modelos de linguagem ponta a ponta multimodais, tornando a interação entre humanos e IA mais interessante e imersiva.