Llasa-1B

Llasa-1B é um modelo de texto para fala (TTS) baseado em LLaMA, que suporta a síntese de voz em chinês e inglês.

Produto ComumOutrosTexto para falaSíntese de voz
Llasa-1B é um modelo de texto para fala desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong. Baseado na arquitetura LLaMA, ele combina marcadores de fala do código XCodec2 para converter texto em fala natural e fluente. O modelo foi treinado em 250.000 horas de dados de voz em chinês e inglês, suportando a geração de voz a partir de texto puro ou utilizando prompts de voz fornecidos. Sua principal vantagem é a capacidade de gerar voz multilíngue de alta qualidade, adequada para diversas aplicações de síntese de voz, como audiolivros e assistentes de voz. Este modelo utiliza a licença CC BY-NC-ND 4.0 e seu uso comercial é proibido.
Abrir Site

Llasa-1B Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

Llasa-1B Tendência de Visitas

Llasa-1B Distribuição Geográfica das Visitas

Llasa-1B Fontes de Tráfego

Llasa-1B Alternativas