DeepSeek 要用蜜雪冰城的打法，做中国版 Claude Code-工信会

> 自媒体 > （AI）人工智能 > DeepSeek 要用蜜雪冰城的打法，做中国版 Claude Code

DeepSeek 要用蜜雪冰城的打法，做中国版 Claude Code

来源：爱范儿

2026-06-01 10:11:16

管理

DeepSeek 永久降价，梁文锋把 Token 价格打骨折了

让我们先来简单梳理一下 DeepSeek 的降价时间线：

4 月 24 日，DeepSeek V4 预览版正式发布。4 月 25 日，DeepSeek 宣布 V4-Pro 开启 2.5 折优惠。4 月 26 日，DeepSeek 宣布缓存命中价格调整为首发价的十分之一。4 月 28 日，DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日。5 月 22 日，DeepSeek 宣布 V4-Pro 永久降价为原价的四分之一。

时间线的关键之处，在于临时折扣变成了永久降价。调整之后，DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元，输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元；

输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后，官方 API 对开发者和企业的吸引力进一步提高。

这个判断未必能完全兑现，但它解释了 DeepSeek 一系列选择背后的方向：

MoE、MLA、DSA、GRPO、RLVR、KV Cache 压缩、Dual Path、TileLang，表面上看是模型架构和推理工程优化，往深处看，都是在降低对高端 HBM、顶级 GPU 和 CUDA 生态的依赖。

一系列降价公告里，最值得关注的不只是输出价格下降，还有缓存命中价格下降。

在大模型推理过程中，KV Cache 是一个关键成本项。模型处理长上下文时，需要把历史 tokens 对应的 Key 和 Value 存起来，后续生成时反复使用。上下文越长，需要保存和读取的缓存越多，对显存、带宽和存储系统的压力也越大。

长上下文和 Agent 任务真正贵的地方，不只是模型生成本身，还有缓存、显存、带宽和重复上下文搬运。

一个 Code Agent 处理项目时，可能要反复读取同一个代码库结构、同一批文件、同一段任务历史、同一套系统提示词和同一批测试日志。若每一轮都按完整上下文重新计费，长任务很快会变贵。缓存命中价格下降后，重复上下文的成本会明显变低。

DeepSeek 近年来在 MoE 架构、长上下文、KV Cache 压缩和推理效率上持续投入的表现有目共睹。降价是技术迭代后的必然结果，也将彻底搅动 AI 编程市场格局。

为什么必须做中国版「Claude Code」？

最先被牵动的，是 AI 编程工具的订阅模式。

市面主流 AI 编程工具均推出 Coding Plan 月付订阅，为用户提供代码补全、模型调用、Agent 执行等权益。在轻量化补全时代，单次调用消耗极低。

但 AI 编程已从单次补全迭代为全流程 Agent 自动化编码，模型可独立完成代码修改、测试运行、报错修复，单次任务 Token 消耗大幅提升。

当底层 API 又同时大幅降价，Coding Plan 也必须找到新的支撑点。这个支撑点，更可能落在工程能力上——比如能不能更好地读懂项目结构，能不能精准选择上下文，能不能控制 tokens 消耗，能不能稳定修改代码，能不能处理 Git、终端、CI/CD，能不能在企业环境里管理权限和审计记录？

同样要重新定位的，还有 API 中转站。对个人开发者来说，便宜和好用仍然重要。但对企业来说，稳定、可审计、可控、可迁移更重要。

沿着这个逻辑继续看，Coding Plan 和中转站的改变只是表层。低价之后更值得追问的，是开发者入口究竟掌握在谁手里。

Google CEO Sundar Pichai 最近接受了《Hard Fork》采访，他首次公开承认，Google 在文本、多模态、语音、推理和整体智能上都很有竞争力，但在 agentic coding 这一类能力上，尤其是工具调用、指令跟随和长周期任务，目前还有差距。

他还提到，更关键的是把模型放到真实世界里使用，让数据回流，继续迭代。Pichai 特别说到，coding 是一个需要接触 data flows（数据流）的领域。

终端工具能看到开发者如何提出任务，如何追问，什么时候接受建议，什么时候放弃，什么时候要求模型继续修复。它还可以通过测试结果、终端日志、文件变更和 Git 提交，判断一次 Agent 执行是否完成任务。这类数据，对 coding model 和 Agent 产品都非常有价值。

从公开招聘动作看，DeepSeek 近期围绕 Agent 的动作也变得密集。

我们也可以看到岗位里出现了 Agent 深度学习算法研究员、Agent 数据策略工程师、产品经理、研发工程师等角色。更关键的是，DeepSeek 资深研究员陈德里直接发出招聘信息，提到要从零开始构建 Code Harness。

如其所说，Model Harness = Agent，在 Agent 产品中，模型负责理解和生成，Harness 负责把模型能力带入真实工程环境，相当于模型外面那套「执行系统」。

DeepSeek 版 Claude Code 不能只给开发者一个对话框，而要给开发者一个能持续执行任务的工程系统。

崔添翼加入 DeepSeek 后受到关注，也和 Code Agent 的工程属性有关。

公开信息显示，崔添翼本科毕业于浙江大学计算机系，曾因信息学竞赛保送浙大，6 次获得 ACM 亚洲区域赛金牌，之后在 Jane Street 工作 9 年，并联合创立 TSY Capital。

Code Agent 的难点不只是生成代码，还要在真实项目里持续执行任务。量化交易系统长期强调低延迟、稳定性、自动化执行和风险控制，这些经验放到 Agent Harness 上，至少在工程范式上是相通的。

而 Agent 工具的产品能力，不只包括写代码，也包括权限、审计、数据隔离和安全策略。

这反过来给 DeepSeek 这样的国产模型提供了机会。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业级权限控制结合起来，它在政企、金融、制造、能源等对数据敏感的行业里，会有更强的替代价值。

DeepSeek 做中国版 Claude Code 的逻辑也正在于此：低价 tokens 把更多开发者吸引进来。低缓存价格让 Agent 任务运行成本下降。Code Harness 让模型进入开发环境。真实工作流又会反过来帮助 DeepSeek 改进模型和产品。

就像滚下坡的雪球，越滚越大，滚得越快。降价只是推下山的第一把力，往后它会自己越滚越沉，谁也拦不住。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

降价只是第一步，DeepSeek 真正要做的事比你想象的大得多

1小时前

500亿元融资到手 DeepSeek V4大模型6月还有重大升级

1小时前