AudioLM

Marco de generación de audio de alta calidad

Producto ComúnOtrosGeneración de audioModelo de lenguaje
AudioLM es un marco desarrollado por Google Research para la generación de audio de alta calidad con consistencia a largo plazo. Mapea el audio de entrada a una secuencia de tokens discretos y considera la generación de audio como una tarea de modelado del lenguaje en este espacio de representación. Entrenado en una gran cantidad de formas de onda de audio sin procesar, AudioLM aprende a generar continuaciones de audio naturales y coherentes. Incluso sin texto o anotaciones, puede generar continuaciones de voz sintáctica y semánticamente plausibles, manteniendo la identidad y el ritmo del hablante. Además, AudioLM puede generar continuaciones coherentes de música de piano, incluso sin usar ninguna representación simbólica de la música durante su entrenamiento.
Abrir sitio web

AudioLM Situación del tráfico más reciente

Total de visitas mensuales

26710

Tasa de rebote

49.93%

Páginas promedio por visita

1.2

Duración promedio de la visita

00:00:07

AudioLM Tendencia de visitas

AudioLM Distribución geográfica de las visitas

AudioLM Fuentes de tráfico

AudioLM Alternativas