MegaTTS 3 est un modèle de synthèse vocale efficace basé sur PyTorch, développé par ByteDance, avec une capacité de clonage vocal de très haute qualité. Son architecture légère ne contient que 0,45 milliard de paramètres, prend en charge le chinois, l'anglais et le code, et peut générer une parole naturelle et fluide à partir d'un texte d'entrée. Il est largement utilisé dans la recherche académique et le développement technologique.