バイトダンスDoubao大規模言語モデル、リアルタイム音声通話に対応：いつでも中断、リアルタイム秒レス

AIbase基地

公開日AIニュース · 1 分で読めます · Aug 9, 2024

965

本日、バイトダンス傘下のクラウドサービスプラットフォームである火山引擎は、豆包大規模言語モデルがリアルタイム音声通話の新機能に対応したことを発表しました。

火山引擎が提供する対話型AIリアルタイムインタラクションソリューションは、火山方舟大規模言語モデルサービスプラットフォームと豆包の音声認識・合成モデルを組み合わせることで、音声テキスト化とテキスト音声化のプロセスを簡素化しています。このソリューションは、効率的な音声データの収集、処理、伝送を実現し、優れたインテリジェントな対話と自然言語処理能力を提供します。

バイトダンス抖音豆包大規模言語モデル

火山引擎RTCは、オーディオ3A処理技術に基づき、「双方向同時通話」現象を効果的に解決し、音声認識の精度とリアルタイム性を確保します。同時に、WebRTC伝送ネットワークを利用することで、世界規模での超低遅延、安定した信頼性の高いリアルタイムの音声・ビデオ伝送サービスを実現しています。

火山引擎は、自己統合ソリューションとWebRTC標準プロトコルベースの伝送ネットワークソリューションを含む、柔軟で多様な接続ソリューションを提供し、様々な企業の具体的なニーズを満たしています。

さらに、火山引擎の大規模言語モデルマルチモーダルリアルタイムインタラクションサービスは、国内の一部の主要なAIバーチャルキャラクターチャットアプリケーションにAIリアルタイム音声機能を提供しており、全く新しいインタラクティブ体験をもたらしています。火山引擎は、高品質の音声・ビデオ能力とAI能力を継続的に提供し、企業がAIリアルタイム音声・ビデオ分野でのイノベーションを達成することを支援します。

バイトダンス、Doubao大規模言語モデル1.5Proを発表、GPT-4oとClaude3.5Sonnetを性能で上回る

バイトダンスは、最新のDoubao大規模言語モデル1.5Pro（Doubao-1.5-pro）を発表しました。この新しいモデルは、複数の分野で優れた総合的な能力を発揮し、業界をリードするGPT-4oやClaude3.5Sonnetを上回る性能を達成しました。このモデルの発表は、バイトダンスの人工知能分野における重要な一歩を示しています。Doubao 1.5Proは、新しいスパースMoE（混合専門家）アーキテクチャを採用しており、少ない活性化パラメーターで事前学習が行われています。この設計により、

増量据え置き！豆包大規模言語モデル1.5正式リリース Doubao-1.5-vision-proなど

2025年1月22日、バイトダンス傘下の火山エンジンは、豆包大規模言語モデル1.5の正式リリースと、火山方舟プラットフォームへの全面展開を発表しました。今回の豆包大規模言語モデル1.5は、複数の分野で顕著な性能向上を実現し、総合的な能力は世界をリードするレベルに達しており、バイトダンスの人工知能分野における新たな大きな進歩を示しています。

抖音副社長、大規模言語モデル価格競争の否定：AI技術の普及と応用促進を推進

本日、バイトダンスが再び大規模言語モデル価格競争を巻き起こす可能性があるという噂に対し、抖音副社長の李亮氏はソーシャルメディアで声明を発表し、価格競争ではないと明確に述べました。李亮氏は、Doubao大規模言語モデルは技術革新によりコストを削減し、アルゴリズム、ソフトウェアエンジニアリング、ハードウェアソリューションにおいて多くの最適化が行われたと指摘しました。同氏は、1000トークンあたり3厘の価格設定は、かなりの粗利益を確保できるだけでなく、従来の「掲載料金割引」モデルとは異なる透明な価格戦略であると述べています。

AIニュース

バイトダンスDoubao大規模言語モデル、リアルタイム音声通話に対応：いつでも中断、リアルタイム秒レス

AIbase基地

関連AIニュースの推奨

Hugging FaceがFastRTCを発表：リアルタイム音声ビデオアプリケーション開発が容易に

バイトダンス、Doubao大規模言語モデル1.5Proを発表、GPT-4oとClaude3.5Sonnetを性能で上回る

増量据え置き！豆包大規模言語モデル1.5正式リリース Doubao-1.5-vision-proなど

抖音副社長、大規模言語モデル価格競争の否定：AI技術の普及と応用促進を推進