Amélioration du système de reconnaissance vocale ASR de Tencent Cloud

Le système de reconnaissance vocale ASR de Tencent Cloud a bénéficié d'une mise à niveau récente, améliorant ainsi sa capacité à traiter les dialectes et le bruit. ASR prend en charge la reconnaissance de 23 dialectes régionaux et peut gérer les situations de mélange de dialectes. Grâce à son moteur de reconnaissance hybride développé en interne, ASR peut identifier et basculer rapidement entre différents dialectes.

En utilisant des algorithmes de distillation et un entraînement semi-supervisé, ASR peut apprendre efficacement à partir de données étiquetées et non étiquetées, et peut même traiter les dialectes minoritaires. Pour la reconnaissance sémantique, ASR utilise un grand modèle linguistique pour extraire l'intention grâce au contexte sémantique et aux mégadonnées, améliorant ainsi la précision de la reconnaissance.

De plus, ASR a développé une capacité anti-parasitage grâce à l'apprentissage autonome et à des algorithmes d'optimisation. Il peut filtrer automatiquement le bruit et améliorer la précision de la reconnaissance. ASR est déjà largement utilisé dans les produits internes de Tencent et dans divers secteurs externes, servant des milliers de clients entreprises avec un volume d'appels quotidien atteignant des dizaines de milliards.