3月1日,DeepSeek在其“开源周”第六日发布压轴成果,首次披露DeepSeek-V3/R1推理系统的核心技术细节与商业化数据。根据官方数据,该系统理论成本利润率高达545%。
DeepSeek 统计了2月27日24点至2月28日24点的数据,得出其每日总成本为87072美元,折合人民币约63万元。若所有Token均按 DeepSeek-R1的价格计费,每日总收入将达562027美元,折合人民币约409万元,成本利润率高达545%。这意味着理论上,DeepSeek每日净赚474955美元,折合人民币约346万元。然而,实际情况却大相径庭,DeepSeek的收入出现大幅下滑。原因在于,DeepSeek-V3定价低于R1,且网页端和应用程序免费,仅部分服务产生收入,再加上非高峰时段设有夜间折扣,导致其实际收入远不及理论数值。
此外,DeepSeek还公布了DeepSeek-V3/R1推理系统概述。为实现更高的推理吞吐量与更低延迟,研究人员采用了跨节点的专家咨询(EP)。通过EP增大batch size、将通信延迟隐藏在计算之后,并执行负载均衡,以此应对EP带来的系统复杂性挑战。