AudioLM
Marco de generación de audio de alta calidad
Producto ComúnOtrosGeneración de audioModelo de lenguaje
AudioLM es un marco desarrollado por Google Research para la generación de audio de alta calidad con consistencia a largo plazo. Mapea el audio de entrada a una secuencia de tokens discretos y considera la generación de audio como una tarea de modelado del lenguaje en este espacio de representación. Entrenado en una gran cantidad de formas de onda de audio sin procesar, AudioLM aprende a generar continuaciones de audio naturales y coherentes. Incluso sin texto o anotaciones, puede generar continuaciones de voz sintáctica y semánticamente plausibles, manteniendo la identidad y el ritmo del hablante. Además, AudioLM puede generar continuaciones coherentes de música de piano, incluso sin usar ninguna representación simbólica de la música durante su entrenamiento.
AudioLM Situación del tráfico más reciente
Total de visitas mensuales
26710
Tasa de rebote
49.93%
Páginas promedio por visita
1.2
Duración promedio de la visita
00:00:07