StreamSpeech
リアルタイム音声翻訳、異言語コミュニケーションの架け橋。
プレミアム新製品生産性リアルタイム翻訳マルチタスク学習
StreamSpeechは、マルチタスク学習に基づいたリアルタイム音声対音声翻訳モデルです。統一フレームワークを通じて翻訳と同期戦略を同時に学習することで、ストリーミング音声入力における翻訳タイミングを効果的に認識し、高品質なリアルタイムコミュニケーション体験を実現します。このモデルはCVSSベンチマークテストでトップレベルの性能を達成しており、ASRや翻訳結果などの低遅延の中間結果を提供できます。