騰訊クラウドの音声認識システムASRのアップグレード

騰訊クラウドが新たに発表した音声認識システムASRがアップグレードされ、方言やノイズへの対応能力が向上しました。

ASRは23種類の方言に対応し、複数の地方の方言が混ざった状況にも対応可能です。独自開発のハイブリッド認識エンジンにより、ASRは異なる方言を迅速に認識し、切り替えることができます。

蒸留アルゴリズムと半教師あり学習を採用することで、ASRはラベル付きデータとラベルなしデータを効率的に学習し、少数民族のマイナーな方言にも対応できます。

意味認識においては、ASRは大規模言語モデルを使用し、文脈と大量データから意図を抽出し、認識精度を向上させています。

さらに、ASRは独自の学習と最適化アルゴリズムを通じて、ノイズ耐性を向上させ、ノイズを自動的に除去し、認識精度を高めています。

ASRは既に騰訊内部製品や外部の様々な業界で広く利用されており、数千社のお客様にサービスを提供し、1日の呼び出し回数は100億回に達しています。