AudioLM

Cadre de génération audio haute fidélité

Produit OrdinaireAutreGénération audioModèle linguistique
AudioLM est un cadre développé par Google Research pour la génération audio haute fidélité, assurant une cohérence à long terme. Il mappe l'audio d'entrée à une séquence de jetons discrets et traite la génération audio comme une tâche de modélisation linguistique dans cet espace de représentation. Entraîné sur un vaste corpus de formes d'onde audio brutes, AudioLM apprend à générer des continuations audio naturelles et cohérentes. Il peut même générer des continuations de parole grammaticalement et sémantiquement cohérentes sans texte ni annotation, tout en préservant l'identité et le rythme du locuteur. De plus, AudioLM peut générer des continuations cohérentes de musique pour piano, même sans représentation symbolique musicale lors de son entraînement.
Ouvrir le site Web

AudioLM Dernière situation du trafic

Nombre total de visites mensuelles

26710

Taux de rebond

49.93%

Nombre moyen de pages par visite

1.2

Durée moyenne de la visite

00:00:07

AudioLM Tendance des visites

AudioLM Distribution géographique des visites

AudioLM Sources de trafic

AudioLM Alternatives