本日、バイトダンス傘下のクラウドサービスプラットフォームである火山引擎は、豆包大規模言語モデルがリアルタイム音声通話の新機能に対応したことを発表しました。

火山引擎が提供する対話型AIリアルタイムインタラクションソリューションは、火山方舟大規模言語モデルサービスプラットフォームと豆包の音声認識・合成モデルを組み合わせることで、音声テキスト化とテキスト音声化のプロセスを簡素化しています。このソリューションは、効率的な音声データの収集、処理、伝送を実現し、優れたインテリジェントな対話と自然言語処理能力を提供します。

バイトダンス抖音豆包大規模言語モデル

火山引擎RTCは、オーディオ3A処理技術に基づき、「双方向同時通話」現象を効果的に解決し、音声認識の精度とリアルタイム性を確保します。同時に、WebRTC伝送ネットワークを利用することで、世界規模での超低遅延、安定した信頼性の高いリアルタイムの音声・ビデオ伝送サービスを実現しています。

火山引擎は、自己統合ソリューションとWebRTC標準プロトコルベースの伝送ネットワークソリューションを含む、柔軟で多様な接続ソリューションを提供し、様々な企業の具体的なニーズを満たしています。

さらに、火山引擎の大規模言語モデルマルチモーダルリアルタイムインタラクションサービスは、国内の一部の主要なAIバーチャルキャラクターチャットアプリケーションにAIリアルタイム音声機能を提供しており、全く新しいインタラクティブ体験をもたらしています。火山引擎は、高品質の音声・ビデオ能力とAI能力を継続的に提供し、企業がAIリアルタイム音声・ビデオ分野でのイノベーションを達成することを支援します。