硅基流动官微宣布,即刻起,硅基流动SiliconCloud平台的DeepSeek-R1&V3API支持批量推理(BatchInference)。

用户通过批量 API 发送请求到 SiliconCloud,不受实时推理速率限制的影响,预期可在24小时内完成任务。相比实时推理,DeepSeek-V3 批量推理价格直降50%,其中,3月11日至3月18日,DeepSeek-R1批量推理优惠价格直降75%,输入价格为 1元 / 百万 Tokens、输出价格为4元 / 百万 Tokens。

批量推理可帮助用户更高效处理生成报告、数据清洗等大批量数据处理任务,享受更低成本的 DeepSeek-R1& V3API 服务,适用于无需实时响应的数据分析、模型性能评估等场景。

图片