この度、テンセントクラウドTIプラットフォームは、大注目のDeepSeekシリーズモデルを正式にリリースしました。パラメータ数が6710億個に達する「フルバージョン」のV3とR1オリジナルモデル、そしてDeepSeek-R1を蒸留して得られた700億~15億パラメータのシリーズモデルが含まれています。この取り組みは、開発者に強力なAIツールを提供し、大規模モデル技術の普及と応用をさらに促進します。
DeepSeekシリーズモデルは、その卓越した性能で世界的に注目を集めています。中でもDeepSeek-R1は公開時にオープンソース化され、後学習段階で強化学習技術を大規模に使用することで、わずかなアノテーションデータしかない場合でも、モデルの推論能力を大幅に向上させます。数学、コード、自然言語推論などのタスクにおいて、DeepSeek-R1の性能はOpenAIのGPT-4正式版に匹敵します。さらに、DeepSeek-R1はMITライセンスに準拠しており、蒸留技術を用いて他のモデルを学習することが可能です。その蒸留モデルであるDeepSeek-R1-Distillは、パラメータ規模が小さく推論コストも低いにもかかわらず、ベンチマークテストで優れた性能を示しています。
テンセントクラウドTIプラットフォームは、DeepSeekシリーズモデルのワンクリック展開を全面的にサポートするだけでなく、R1モデルの無料オンライン体験を期間限定で提供し、開発者に手軽な体験を提供します。「TIプラットフォーム-大規模モデル広場」でDeepSeekシリーズモデルのカードをクリックすると、モデル情報を確認し、オンライン体験やワンクリック展開を行うことができます。さらに、TIプラットフォームは、モデルサービス管理、監視運用、リソーススケーリングなどのエンタープライズレベルの機能を提供し、企業や開発者がDeepSeekモデルを効率的かつ安定的に実際の業務に導入できるよう支援します。
様々なユーザーのニーズに対応するため、TIプラットフォームは従量課金と年間契約/月間契約の複数の課金方式を提供しています。短時間体験が必要なユーザーは、TIプラットフォームから直接コンピューティングパワーを購入し、従量課金方式を選択できます。一方、CVMマシンを購入済みの方や長期間体験が必要なユーザーには、ご自身のCVMマシンを推論用コンピューティングパワーとして使用することをお勧めします。コンピューティングパワーの構成に関しては、「フルバージョン」DeepSeek-R1は、安定した業務体験を得るために、テンセントクラウド上の8カードHCCPNV6マシンを2台使用したサービス展開をお勧めします。一方、蒸留後のDeepSeek-R1-Distill-Qwen-1.5Bモデルは、ミドルレンジのGPUカード1枚で展開できます。開発者は業務の複雑さに合わせて適切なモデルを選択してテストし、APIを呼び出すことでAIアプリケーションに統合できます。
テンセントクラウドTIプラットフォームのこの新たな取り組みは、開発者に強力なAIツールを提供するだけでなく、大規模モデル技術の普及と応用を力強く推進します。無料体験とワンクリック展開機能により、TIプラットフォームは開発者による大規模モデルの使用障壁を下げ、AI技術を実際の業務に迅速に適用し、AI技術の実用性とアクセシビリティをさらに向上させます。