増量据え置き！豆包大規模言語モデル1.5正式リリース Doubao-1.5-vision-proなど

2025年1月22日、バイトダンス傘下の火山引擎は、豆包大規模言語モデル1.5の正式リリースを発表し、火山方舟プラットフォームで全面的に提供開始しました。今回の豆包大規模言語モデル1.5は、複数の分野で顕著な性能向上を実現し、総合的な能力は世界をリードするレベルに達しており、バイトダンスの人工知能分野における新たな重要な突破を象徴しています。

豆包大規模言語モデル1.5には複数のバージョンが含まれており、その中のDoubao-1.5-proは、知識、コード、推論、中国語など複数の権威ある評価基準で最高の成績を獲得し、GPT-4o、Claude3.5 Sonnetなどの業界トップクラスのモデルを上回る総合的なパフォーマンスを示しました。Doubao-1.5-liteは軽量言語モデルの中で優れたパフォーマンスを発揮し、その性能は以前のDoubao-pro-32k-0828バージョンに匹敵するほどで、ユーザーに高いコストパフォーマンスを提供します。さらに、Doubao-1.5-vision-proは、マルチモーダルデータ合成、動的解像度、マルチモーダルアライメントなどで全面的なアップグレードを行い、視覚推論と細粒度情報理解能力を強化し、複数の権威ある評価基準でトップレベルの結果を達成しました。

微信截图_20250122134135.png

今回の豆包大規模言語モデル1.5のリリースでは、豆包・リアルタイム音声モデルも発表され、エンドツーエンドの音声対話が実現しました。低遅延、会話中にいつでも中断できるなどの特性を備え、音声対話分野に新たな突破をもたらしました。火山引擎は上半期中に方舟プラットフォームを通じて対応するAPIサービスを提供し、音声技術の広範な応用を促進する予定です。

豆包大規模言語モデル1.5は、技術アーキテクチャにおいて大規模スパースMoEアーキテクチャを採用しており、少ない活性化パラメータで7倍の活性化パラメータを持つDenseモデルと同等の性能を実現し、業界の一般的な効率をはるかに凌駕しています。同時に、バイトダンスが独自開発したサーバークラスタソリューションとネットワークカード技術により、ハードウェアコストの大幅な削減、小規模パケット通信効率の最適化を実現し、マルチマシン分散推論の安定性と効率性を確保しました。さらに、豆包大規模言語モデル1.5のトレーニング過程では、他のモデルで生成されたデータは一切使用しておらず、完全に独立したデータ生成システムを構築することで、データソースの独立性と信頼性を確保しています。

注目すべきは、豆包大規模言語モデル1.5は性能と機能において顕著な向上を実現しているにもかかわらず、価格は据え置きで、「増量しても価格は据え置き」の原則を堅持し、AI技術の普及促進に尽力し、より多くの企業や開発者がこの先進的な技術成果の恩恵を受けることができるようにしています。

体験アドレス：https://team.doubao.com/doubao_1_5_pro