Llasa-1B
Llasa-1B é um modelo de texto para fala (TTS) baseado em LLaMA, que suporta a síntese de voz em chinês e inglês.
Produto ComumOutrosTexto para falaSíntese de voz
Llasa-1B é um modelo de texto para fala desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong. Baseado na arquitetura LLaMA, ele combina marcadores de fala do código XCodec2 para converter texto em fala natural e fluente. O modelo foi treinado em 250.000 horas de dados de voz em chinês e inglês, suportando a geração de voz a partir de texto puro ou utilizando prompts de voz fornecidos. Sua principal vantagem é a capacidade de gerar voz multilíngue de alta qualidade, adequada para diversas aplicações de síntese de voz, como audiolivros e assistentes de voz. Este modelo utiliza a licença CC BY-NC-ND 4.0 e seu uso comercial é proibido.
Llasa-1B Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44