Tencent Cloud lance son système de reconnaissance vocale ASR, intégration d'un grand modèle linguistique

站长之家

Publié leActualités IA · 3 minutes de lecture · Jan 5, 2024

249

Amélioration du système de reconnaissance vocale ASR de Tencent Cloud

Le système de reconnaissance vocale ASR de Tencent Cloud a bénéficié d'une mise à niveau récente, améliorant ainsi sa capacité à traiter les dialectes et le bruit. ASR prend en charge la reconnaissance de 23 dialectes régionaux et peut gérer les situations de mélange de dialectes. Grâce à son moteur de reconnaissance hybride développé en interne, ASR peut identifier et basculer rapidement entre différents dialectes.

En utilisant des algorithmes de distillation et un entraînement semi-supervisé, ASR peut apprendre efficacement à partir de données étiquetées et non étiquetées, et peut même traiter les dialectes minoritaires. Pour la reconnaissance sémantique, ASR utilise un grand modèle linguistique pour extraire l'intention grâce au contexte sémantique et aux mégadonnées, améliorant ainsi la précision de la reconnaissance.

De plus, ASR a développé une capacité anti-parasitage grâce à l'apprentissage autonome et à des algorithmes d'optimisation. Il peut filtrer automatiquement le bruit et améliorer la précision de la reconnaissance. ASR est déjà largement utilisé dans les produits internes de Tencent et dans divers secteurs externes, servant des milliers de clients entreprises avec un volume d'appels quotidien atteignant des dizaines de milliards.

FireRedASR : le modèle de reconnaissance vocale open source de Xiaohongshu, offrant une excellente précision pour le chinois

Dans le domaine de la reconnaissance vocale, le développement de la technologie de reconnaissance du chinois a toujours suscité un vif intérêt. Récemment, l'équipe FireRed de Xiaohongshu a publié un nouveau modèle de reconnaissance vocale open source : FireRedASR. Ce système de reconnaissance vocale basé sur un grand modèle a obtenu d'excellents résultats sur plusieurs ensembles de tests standard, marquant une avancée majeure dans la technologie de reconnaissance vocale chinoise. L'indicateur principal de FireRedASR est le taux d'erreur de caractères (CER), un indicateur qui, plus il est bas, indique une meilleure performance du modèle. Lors de récents tests publics, Fi

SoundHound, géant de la reconnaissance vocale IA, enregistre des résultats exceptionnels : un chiffre d'affaires record de 25 millions de dollars

SoundHound AI, entreprise spécialisée dans la technologie vocale IA, annonce une excellente nouvelle : sa solution vocale est désormais déployée chez 7 des 20 plus grandes chaînes de restauration rapide américaines. Le dernier rapport financier de la société révèle un chiffre d'affaires de 25 millions de dollars au troisième trimestre, soit une augmentation de 89 % par rapport à l'année précédente, un nouveau record trimestriel. Selon Keyvan Mohajer, PDG et cofondateur de SoundHound AI, la technologie vocale IA de la société est largement utilisée dans divers contextes, notamment les commandes au volant, les commandes téléphoniques, les bornes libre-service et les applications mobiles.

Actualités IA

Tencent Cloud lance son système de reconnaissance vocale ASR, intégration d'un grand modèle linguistique

站长之家

Recommandations d'actualités IA connexes

Le OnePlus 13 lance le nouveau ColorOS 15.0.0.701 avec une fonctionnalité de reconnaissance vocale AIGC en première mondiale

Le Los Angeles Times utilise l'IA pour analyser le ton des articles, suscitant une crise de confiance dans les médias

FireRedASR : le modèle de reconnaissance vocale open source de Xiaohongshu, offrant une excellente précision pour le chinois

SoundHound, géant de la reconnaissance vocale IA, enregistre des résultats exceptionnels : un chiffre d'affaires record de 25 millions de dollars