バイトダンスは、最新のDoubao大規模言語モデル1.5Pro(Doubao-1.5-pro)を正式に発表しました。この新しいモデルは、複数の分野で総合的な能力に優れており、業界で有名なGPT-4oやClaude3.5Sonnetを上回る成果を達成しました。このモデルの発表は、バイトダンスの人工知能分野における重要な一歩を意味します。
Doubao 1.5Proは、新しいスパースMoE(混合専門家)アーキテクチャを採用し、少ない活性化パラメータで事前学習を行います。この設計の革新的な点は、7倍の活性化パラメータを持つDenseモデルと同等の性能を提供できることで、業界標準のMoEアーキテクチャをはるかに凌駕する効率性(約3倍の向上)を実現しています。この設計により、Doubao大規模言語モデルは、知識、コード、推論、中国語など複数の評価基準でより高いスコアを獲得しています。
主要モデルのアップグレードに加え、バイトダンスはDoubaoビジョン理解モデルDoubao-1.5-vision-proとDoubaoリアルタイム音声モデルDoubao-1.5-realtime-voice-proも同時に発表しました。新しいビジョン理解モデルは、マルチモーダルデータ処理、動的解像度、細粒度情報理解などにおいて全面的な技術アップグレードを行い、ビジュアル推論とテキスト理解能力をさらに向上させています。また、リアルタイム音声モデルの導入により、Doubaoアプリはよりスムーズな音声対話体験を実現し、低遅延と会話中のいつでも中断が可能になります。
バイトダンスは公式に、Doubao大規模言語モデルのトレーニングには外部モデル生成データを使用しておらず、モデルの独立性と信頼性を確保していると発表しました。さらに、すべての新製品の価格は据え置きで、ユーザーはDoubaoアプリで新機能を直接体験できます。
今回の発表会は、バイトダンスのAI分野における継続的な革新能力を示しただけでなく、開発者向けに強力なAPIサポートを提供し、人工知能技術の普及と応用をさらに促進しました。