バイトダンス、Doubao大規模言語モデル1.5Proを発表、GPT-4oとClaude3.5Sonnetを性能で上回る

AIbase基地

公開日AIニュース · 1 分で読めます · Jan 22, 2025

3.0k

バイトダンスは、最新のDoubao大規模言語モデル1.5Pro（Doubao-1.5-pro）を正式に発表しました。この新しいモデルは、複数の分野で総合的な能力に優れており、業界で有名なGPT-4oやClaude3.5Sonnetを上回る成果を達成しました。このモデルの発表は、バイトダンスの人工知能分野における重要な一歩を意味します。

Doubao 1.5Proは、新しいスパースMoE（混合専門家）アーキテクチャを採用し、少ない活性化パラメータで事前学習を行います。この設計の革新的な点は、7倍の活性化パラメータを持つDenseモデルと同等の性能を提供できることで、業界標準のMoEアーキテクチャをはるかに凌駕する効率性（約3倍の向上）を実現しています。この設計により、Doubao大規模言語モデルは、知識、コード、推論、中国語など複数の評価基準でより高いスコアを獲得しています。

主要モデルのアップグレードに加え、バイトダンスはDoubaoビジョン理解モデルDoubao-1.5-vision-proとDoubaoリアルタイム音声モデルDoubao-1.5-realtime-voice-proも同時に発表しました。新しいビジョン理解モデルは、マルチモーダルデータ処理、動的解像度、細粒度情報理解などにおいて全面的な技術アップグレードを行い、ビジュアル推論とテキスト理解能力をさらに向上させています。また、リアルタイム音声モデルの導入により、Doubaoアプリはよりスムーズな音声対話体験を実現し、低遅延と会話中のいつでも中断が可能になります。

バイトダンスは公式に、Doubao大規模言語モデルのトレーニングには外部モデル生成データを使用しておらず、モデルの独立性と信頼性を確保していると発表しました。さらに、すべての新製品の価格は据え置きで、ユーザーはDoubaoアプリで新機能を直接体験できます。

今回の発表会は、バイトダンスのAI分野における継続的な革新能力を示しただけでなく、開発者向けに強力なAPIサポートを提供し、人工知能技術の普及と応用をさらに促進しました。

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

バイトダンスAIプログラミング製品Trae国内版リリース　豆包1.5pro、フルスペック版DeepSeekモデル搭載

中国初のAIネイティブ統合開発環境（AI IDE）Trae国内版が正式にリリースされました。この製品はバイトダンスの技術チームが開発し、開発者に、より効率的でインテリジェントなプログラミング体験を提供することを目指しています。Trae国内版はDoubao-1.5-proを搭載し、フルスペック版DeepSeek R1、V3モデルへの切り替えにも対応しており、プログラミング速度を大幅に向上させ、開発者が複雑な技術的課題に対処するのを支援します。