Recentemente, na Conferência Global de Desenvolvedores Avançados (GDC), a Mobvoi lançou seu mais novo produto: o Xiao Wen, um avatar digital móvel. Com seu corpo flexível e móvel, capacidade de resposta inteligente e experiência de interação fluida, ele chamou a atenção de muitos visitantes, tornando-se um dos destaques da conferência.
Segundo informações, o Xiao Wen é um produto de inteligência incorporada, cuidadosamente desenvolvido pela Mobvoi com base no DeepSeek, no modelo de linguagem próprio "Sequência Macaco" e no chip Qualcomm QCS8550. Ele não apenas possui um "corpo" móvel e flexível, mas também um "cérebro" inteligente, uma aparência atraente, uma voz natural e realista e uma capacidade de interação ágil e fluida. Essas características permitem que o Xiao Wen busque informações, responda perguntas rapidamente e se destaque em áreas como evitação de obstáculos, rastreamento e reconhecimento facial.
Em termos de aplicações, o Xiao Wen demonstra ampla versatilidade. Ele pode funcionar como um guia turístico de IA em salas de exposições e museus; como um recepcionista de IA para empresas, governos e aeroportos, fornecendo informações e orientação; e como um guia turístico de IA, oferecendo roteiros precisos e informações em tempo real. A expansão dessas aplicações demonstra o enorme potencial do Xiao Wen em reduzir custos, aumentar a eficiência e melhorar a experiência do usuário.
Vale destacar que o Xiao Wen também apresenta diversas inovações tecnológicas. Ele utiliza tecnologia de computação de borda, integrando renderização local de avatar, algoritmos de posicionamento de microfone e algoritmos de visão local em IA de ponta, permitindo renderização eficiente de ponta e interação de baixa latência. Além disso, o Xiao Wen suporta interação de avatar multimodal, incluindo avatares 2.5D, 3D e avatares a partir de fotos, oferecendo aos usuários uma experiência diversificada.
Além disso, o Xiao Wen se destaca na qualidade de áudio. Ele emprega tecnologia de clonagem de voz de modelo de linguagem de ponta, capaz de clonar uma voz em apenas 3 segundos. Ele também possui um vasto banco de dados de vozes de IA, com mais de 1000 vozes, e suporta a seleção de vários idiomas, oferecendo uma experiência auditiva rica.
Quanto ao futuro desenvolvimento do Xiao Wen, a Mobvoi afirma que continuará a se dedicar à tecnologia de modelos de linguagem multimodal, melhorando continuamente o nível de inteligência e a experiência de interação do produto. A empresa também expandirá ativamente os cenários de aplicação, promovendo o papel do Xiao Wen em mais áreas.