AudioLM
Estrutura de geração de áudio de alta qualidade
Produto ComumOutrosGeração de áudioModelo de linguagem
O AudioLM é uma estrutura desenvolvida pelo Google Research para geração de áudio de alta qualidade com consistência a longo prazo. Ele mapeia o áudio de entrada para uma sequência de tokens discretos e trata a geração de áudio como uma tarefa de modelagem de linguagem nesse espaço de representação. Treinado em um vasto conjunto de formas de onda de áudio cruas, o AudioLM aprende a gerar continuações de áudio naturais e coerentes. Mesmo sem texto ou anotações, ele consegue gerar continuações de fala gramatical e semanticamente plausíveis, mantendo a identidade e a prosodia do locutor. Além disso, o AudioLM pode gerar continuações coerentes de música de piano, mesmo sem usar representações simbólicas de música durante o treinamento.
AudioLM Situação do Tráfego Mais Recente
Total de Visitas Mensais
26710
Taxa de Rejeição
49.93%
Média de Páginas por Visita
1.2
Duração Média da Visita
00:00:07