AudioLM

Estrutura de geração de áudio de alta qualidade

Produto ComumOutrosGeração de áudioModelo de linguagem
O AudioLM é uma estrutura desenvolvida pelo Google Research para geração de áudio de alta qualidade com consistência a longo prazo. Ele mapeia o áudio de entrada para uma sequência de tokens discretos e trata a geração de áudio como uma tarefa de modelagem de linguagem nesse espaço de representação. Treinado em um vasto conjunto de formas de onda de áudio cruas, o AudioLM aprende a gerar continuações de áudio naturais e coerentes. Mesmo sem texto ou anotações, ele consegue gerar continuações de fala gramatical e semanticamente plausíveis, mantendo a identidade e a prosodia do locutor. Além disso, o AudioLM pode gerar continuações coerentes de música de piano, mesmo sem usar representações simbólicas de música durante o treinamento.
Abrir Site

AudioLM Situação do Tráfego Mais Recente

Total de Visitas Mensais

26710

Taxa de Rejeição

49.93%

Média de Páginas por Visita

1.2

Duração Média da Visita

00:00:07

AudioLM Tendência de Visitas

AudioLM Distribuição Geográfica das Visitas

AudioLM Fontes de Tráfego

AudioLM Alternativas