4月17日、杭州で開催されたVolcano Engine AIイノベーションツアーのローンチイベントで、バイトダンス傘下のVolcano Engineの社長であるTan Dai氏が、最新の深層推論モデルDoubao 1.5を発表しました。この発表は多くの業界関係者の注目を集め、Tan Dai氏はイベントで、様々な分野におけるモデルの優れたパフォーマンスを紹介しました。
情報によると、Doubao 1.5モデルは、数学、プログラミング、科学的推論などの専門分野、そしてクリエイティブライティングにおいて、卓越した能力を示しています。この新しいモデルは、MoE(Mixture of Experts)アーキテクチャを採用しており、パラメータ数は合計200億個ですが、アクティブなパラメータはわずか20億個です。これは業界の同等のモデルのパラメータ規模を大幅に下回り、推論コストの面で明確なメリットをもたらします。
Tan Dai氏は、深層推論モデルDoubao 1.5の強力な機能を詳しく紹介し、画像認識技術を組み合わせた様々なアプリケーションが含まれていることを強調しました。これらの機能は、写真からのシーン分析だけでなく、旅行中の食事の注文支援や、企業のプロジェクト管理ワークフローの円滑化にも役立ちます。
さらに、Volcano Engineは、テキストから画像を生成するDoubaoモデルのバージョン3.0も発表しました。このアップデートにより、より洗練されたテキストフォーマット、より高度な画像生成能力、そして2Kでの画像の直接出力機能が追加されました。ユーザーはより豊かな視覚体験を楽しむことができます。
さらに注目すべきは、新しいモデルのビデオ検索機能の改善です。検索時に、モデルはビデオ内の関連する回答を即座に見つけることができます。この機能は、ユーザーの情報取得の利便性を大幅に向上させます。
Tan Dai氏によると、Doubaoモデルの使用は驚異的な速度で増加しています。2025年3月には、Doubaoモデルの1日あたりのトークン使用量が12.7兆を突破し、初期リリース時と比較して106倍以上の増加となりました。この数値は、市場におけるDoubaoモデルの人気の高さを如実に示しています。
ハイライト:
📈 Doubao 1.5モデルは、専門分野とクリエイティブライティングにおいて卓越したパフォーマンスを発揮し、高度なMoEアーキテクチャと最適化されたパラメータ構成を採用しています。
🌍 画像認識技術と組み合わせた新しいモデルは、写真の分析、旅行やプロジェクト管理の支援など、強力な機能を提供します。
🎥 ビデオ検索機能が大幅に向上し、ユーザーはビデオ内の関連情報を迅速にアクセスでき、使用率は増加を続けています。