シリコンクラウド公式アカウントよりお知らせいたします。SiliconCloudプラットフォームのDeepSeek-R1&V3 APIにおいて、バッチ推論(Batch Inference)のサポートを開始いたしました。
ユーザー様はバッチAPIを通じてSiliconCloudにリクエストを送信できます。リアルタイム推論速度の制限を受けずに、24時間以内にタスク完了を予定しております。リアルタイム推論と比較して、DeepSeek-V3のバッチ推論価格は50%割引となります。さらに、3月11日から3月18日までは、DeepSeek-R1のバッチ推論価格が75%割引となり、入力価格は1元/百万トークン、出力価格は4元/百万トークンとなります。
バッチ推論は、レポート作成、データクレンジングなど、大量データ処理タスクをより効率的に処理し、DeepSeek-R1&V3 APIサービスを低コストで利用できるよう支援します。リアルタイムレスポンスが不要なデータ分析、モデル性能評価などのシナリオに最適です。