今天中午,我正在扒外卖的时候,手机突然震了一下。
群里有人甩了个链接,说DeepSeek V4发布了。
我第一反应是——假的吧?毕竟过去半年关于V4跳票、难产、被别家超越的传言跑了好几轮,年初还有人信誓旦旦说春节前发,结果等到四月底都没动静。
结果点开一看,卧槽,是真的。
4月24日,DeepSeek V4预览版正式上线,同步开源。一口气发了两个版本:Pro版1.6万亿参数、激活490亿;Flash版2840亿参数、激活130亿。两个版本都支持100万token上下文,而且从今天开始,1M上下文直接成了DeepSeek所有官方服务的标配。
说实话,这个操作有点离谱。
一年前,100万上下文还是Gemini独家的王牌。其他闭源模型要么128K要么200K,开源这边几乎没人玩得起这个量级。现在DeepSeek直接把百万上下文从一个"高端功能"挪成了"水电煤",而且还开源。
他们怎么做到的?我翻了一下技术报告,发现答案藏在底层架构里。
拆开看:V4的注意力机制到底干了什么
标准Transformer的自注意力,要让每个token跟序列里所有其他token算相关性权重。这是平方复杂度——序列翻倍,算力变四倍。处理100万token在传统架构下几乎无法商业化。
V4的方案是CSA加HCA混合注意力架构。
CSA(压缩稀疏注意力)解决的是"算什么"的问题。用轻量级索引器先对所有token对做粗筛,快速估算相关性排序,再精选出需要完整计算的token集合。这套稀疏结构是可训练的——模型在训练过程中自己学出哪里需要高密度注意力,哪里可以稀疏。半年前V3.2-Exp首次引入DSA的时候,外界关注度不高,因为跑分看起来没什么亮点。现在回头看,那是V4的地基。
HCA(重度压缩注意力)解决的是"存什么"的问题。在V3时代MLA多头潜在注意力的基础上继续推进,把KV向量映射到低维潜空间,推理时解压。叠上FP4加FP8混合精度——MoE专家参数用FP4,其余用FP8——KV缓存的显存占用再砍一半。
两者叠加的效果,技术报告里给了两个数字:在1M token场景下,V4-Pro的单token推理FLOPs只有V3.2的27%,KV缓存用量只有10%。
换算过来,同等算力下能服务的长上下文并发量大概是原来的3到4倍。
Agent能力这次真的支棱起来了
V4另一个让我意外的点,是Agent能力。
官方说,在Agentic Coding评测中,V4-Pro已经达到当前开源模型最佳水平。内部员工实测反馈是:使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。
划重点——接近的是非思考模式,跟Opus 4.6思考模式(就是那个会显示完整推理过程的版本)还有差距。但说实话,能做到这个程度已经很离谱了。
更具体的数字是:SWE Verified测试集80.6分,Claude Opus 4.6是80.8分,几乎打平。Terminal Bench 2.0是67.9分,GPT-5.4是68.5分,差距不到1个百分点。
Codeforces编程竞赛评分达到3206分,这个数字在已公开评测的开源模型里是最高的,甚至超过了GPT-5.4的3168分。
数学和STEM领域的表现同样炸裂。IMO答案评测89.8%,仅次于GPT-5.4的91.4%。HMM数学竞赛2026达到95.2%。
一句话概括:数学、代码、Agent三个维度,V4-Pro在开源领域已经没有任何对手。
定价这次真的杀疯了
说完成绩,再看看价格。
V4-Pro每百万tokens输入(缓存命中)1元,输出24元。V4-Flash每百万tokens输入(缓存命中)只要0.2元,输出2元。
这个定价什么概念?去年V3刚出的时候,DeepSeek就因为"价格屠夫"的定位被业内关注。这次V4等于把性价比优势继续保持,而且还把100万上下文这个曾经的高端功能打包进去了。
不过有个细节要提醒一下:目前V4-Pro的服务吞吐十分有限,官方在小字里写了,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。
关于昇腾这件事,我多说两句。V4的技术报告里明确提到,细粒度专家并行方案同时在NVIDIA GPU和华为昇腾NPU上完成验证。这说明DeepSeek已经在为多算力环境做准备了——一边在现有CUDA生态内做极致优化,一边也在给华为等国产芯片预留空间。
对于国内开发者来说,这算是个好消息。毕竟去年昇腾910C适配DeepSeek的时候,因为稳定性问题导致分布式训练频繁崩溃,项目一度被迫退回英伟达GPU。从910C到950PR,DeepSeek花了整整一年多才解决这些问题。如果下半年昇腾950真的能批量上市,国产算力部署V4的可行性会大幅提升。
说实话,看完V4的技术报告和官方发布稿,我最大的感受是:DeepSeek这波操作,把"普惠"两个字刻进了产品的每一处设计里。
百万上下文免费可用、Agent能力对齐顶级闭源模型、价格继续保持杀伤力——而且还开源。
发布稿结尾DeepSeek自己引用了一句话,来自荀子《非十二子》:"不诱于誉,不恐于诽,率道而行,端然正己。"
过去半年各种传言他们一次都没回应过。然后在某个周五下午,把V4放出来,同步开源,同步上线官网和App,同步更新API。
没有直播,没有访谈,没有PPT吹牛。
这个风格,我挺喜欢的。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105789