5 月 22 日晚上,DeepSeek 在定价说明里改了一行字:原本限时的 2.5 折优惠,从此转为长期价格。换算下来,旗舰模型 V4-Pro 的 API 调用价在 5 月 31 日活动结束后,正式降到原价的四分之一——百万 token 的缓存命中价从 0.1 元降到 0.025 元,输入(缓存未命中)从 12 元降到 3 元,输出从 24 元降到 6 元。

国产模型降价,本来算不上什么大新闻。让这件事显得刺眼的是它的背景:过去半年,几乎整个行业都在往上调价。
关键数据卡 · V4-Pro API 调价
每百万 token
原价
新价
输入 · 缓存命中
0.1 元
0.025 元
输入 · 缓存未命中
12 元
3 元
输出
24 元
6 元
统一降至原价的 1/4,降幅约 75%,5 月 31 日后长期生效。

先看清它在逆什么"势"
2026 年以来,云和大模型这门生意打破了十多年"只降不涨"的惯例。涨价的根子在硬件:HBM、DDR5 这类内存半年里涨幅普遍超过 60%,部分品类相对 2025 年 6 月涨超 500%,SK 海力士和三星的 HBM 产能甚至已排到 2027 年底。成本压到下游,定价跟着普涨。
厂商
AI 相关服务涨幅
亚马逊 AWS
部分 AI 算力服务涨超 20%
微软 Azure
AI 推理与云数据库涨 15%–30%
谷歌云
高端算力资源涨超 25%
阿里云
AI 算力、GPU 租用最高涨 34%
腾讯云 / 百度 / 华为云
核心算力产品涨 10%–25%
也就是说,DeepSeek 这一刀,不是在一个价格战的常态里再补一刀,而是在一个大家都被供应链按着头涨价的环境里,反向走。问题就来了:别人是被成本逼着涨,它凭什么还能降?
降价和涨价,其实是同一件事的两面
答案藏在 4 月 24 日发布、同步开源的 V4 身上。V4-Pro 是一个总参数 1.6 万亿、采用 MoE 架构、原生支持 100 万 token 上下文的模型,它带了一套新的稀疏注意力机制(DSA)。按官方给出的数字,在 1M 上下文这种最烧钱的场景下,V4-Pro 单 token 的推理算力只有上一代 V3.2 的 27%,KV Cache 占用只有 10%。
更关键的一层在硬件侧。据多家报道,V4 这一代把底层从英伟达 CUDA 大幅迁到了华为的 CANN 框架,训练和推理都更多压在国产算力上,DeepSeek 也为此推迟了发布、重写了不少底层代码。具体迁移到哪几款芯片、迁得多彻底,公开信息说法不一,这里不展开;但方向是清楚的——它的成本曲线,正在尽量从那条让所有人涨价的英伟达 HBM 供应链上挪开。
所以"涨价"和"降价"是一枚硬币的两面:同一批 HBM 和 GPU 的紧缺,把绑在这条供应链上的厂商成本顶了上去,也给了一个把推理效率和国产算力都做到位的玩家,一个反向定价的空间。这是新闻标题不会讲、但真正决定这次降价能不能成立的那一层。
那个 0.025 元,是给 Agent 时代留的钩子
值得多看一眼的是降价的结构。三项里降得绝对值最狠的,是缓存命中价:从 0.1 元砍到 0.025 元。这一项对应的,恰恰是长上下文、多轮对话、反复读同一份代码库或文档的工作负载——也就是今天所有 Agent 应用最敏感的那笔成本。
把它和 V4-Pro 的定位连起来看,意图就不含糊了:DeepSeek 称内部员工已经把 V4-Pro 当作日常的编码 Agent 在用,对标的是 Claude 这一档。换句话说,这不是无差别撒钱式降价,而是精准补贴 Agentic 编码这个正在起量的场景,用价格去换开发者把工作流搬过来。对一个高频调用、按 token 烧钱的 Agent 团队来说,这个价差不是省一点,是能直接改变技术选型的量级。
同一周,太平洋两边在玩两种游戏
把时间轴拉到这一周,对照会更有意思。就在 DeepSeek 宣布永久降价的前后,Anthropic 正在洽谈一轮估值超过 9000 亿美元、规模逾 300 亿美元的融资,若落地将首次超过 OpenAI 今年 3 月的 8520 亿美元估值;而 OpenAI 那边在筹备 IPO。
分类
Anthropic / OpenAI
DeepSeek
估值 / 融资
Anthropic 拟超 9000 亿美元估值融资逾 300 亿;OpenAI 备战 IPO
推进约 700 亿元人民币融资,投前估值约 450 亿美元
出资方
红杉、Altimeter 等顶级 VC
国家大基金、腾讯、IDG 等在洽谈
模型
闭源
开源
价格方向
上调 API 价格
永久下调至 1/4
对外口径
估值与营收飞轮
向投资人表示优先突破性研究,而非短期商业化
9000 亿对 450 亿,差着二十倍的估值;一边靠闭源加估值飞轮把数字往上抬,一边拿着部分国家资本、把价格往下打来换生态和算力自主。这两条路当然都还没分出对错,但它们想赢的方式,从一开始就不是同一种。

谁最难受,以及一件没被说清的事
这一刀砍下去,短期内最难受的未必是大洋彼岸的 OpenAI,而更可能是同样指望靠 API 收入撑住现金流的国内同行——Qwen、Kimi、智谱们。当一个开源、能力对标第一梯队、又把价格做到同级新低的选项摆在面前,中小厂商靠"差不多的能力、差不多的价格"留住开发者的空间会被进一步压窄。对海外那些对成本敏感、又不排斥用开源权重的团队来说,这个价位也确实有吸引力。
需要留一个余地的是:现在公开的信息里,没有 V4-Pro 这条产品线的毛利数据。所以"这个价格究竟是规模化之后的合理定价,还是建立在国产算力和国家资本输血之上的、阶段性的低价",目前还无法判断——任何往哪个方向下的断言,都超出了已有材料能支撑的范围。这一点不该含糊带过。
能确定的,大概只有一件:在"模型有多聪明"之外,"每个 token 到底花多少钱、这笔钱受不受制于别人的供应链",正在变成一个同样要紧的问题。DeepSeek 这次没有比拼分数,而是把这条一直存在、却很少被摆到台面的战线,直接标了价。
如果说claude走出的是让企业利用AI大幅降本的路,那么Deepseek一开始的目标就是为了大众普惠使用AI降本提效,二者都是推动时代发展的主要动力。
相关文章




猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113339