扒外卖时收到DeepSeek V4发布消息，我用完后的真实感受-工信会

> 自媒体 > （AI）人工智能 > 扒外卖时收到DeepSeek V4发布消息，我用完后的真实感受

扒外卖时收到DeepSeek V4发布消息，我用完后的真实感受

来源：炎上世间妖邪

2026-04-28 21:29:47

管理

今天中午，我正在扒外卖的时候，手机突然震了一下。

群里有人甩了个链接，说DeepSeek V4发布了。

我第一反应是——假的吧？毕竟过去半年关于V4跳票、难产、被别家超越的传言跑了好几轮，年初还有人信誓旦旦说春节前发，结果等到四月底都没动静。

结果点开一看，卧槽，是真的。

4月24日，DeepSeek V4预览版正式上线，同步开源。一口气发了两个版本：Pro版1.6万亿参数、激活490亿；Flash版2840亿参数、激活130亿。两个版本都支持100万token上下文，而且从今天开始，1M上下文直接成了DeepSeek所有官方服务的标配。

说实话，这个操作有点离谱。

一年前，100万上下文还是Gemini独家的王牌。其他闭源模型要么128K要么200K，开源这边几乎没人玩得起这个量级。现在DeepSeek直接把百万上下文从一个"高端功能"挪成了"水电煤"，而且还开源。

他们怎么做到的？我翻了一下技术报告，发现答案藏在底层架构里。

拆开看：V4的注意力机制到底干了什么

标准Transformer的自注意力，要让每个token跟序列里所有其他token算相关性权重。这是平方复杂度——序列翻倍，算力变四倍。处理100万token在传统架构下几乎无法商业化。

V4的方案是CSA加HCA混合注意力架构。

CSA（压缩稀疏注意力）解决的是"算什么"的问题。用轻量级索引器先对所有token对做粗筛，快速估算相关性排序，再精选出需要完整计算的token集合。这套稀疏结构是可训练的——模型在训练过程中自己学出哪里需要高密度注意力，哪里可以稀疏。半年前V3.2-Exp首次引入DSA的时候，外界关注度不高，因为跑分看起来没什么亮点。现在回头看，那是V4的地基。

HCA（重度压缩注意力）解决的是"存什么"的问题。在V3时代MLA多头潜在注意力的基础上继续推进，把KV向量映射到低维潜空间，推理时解压。叠上FP4加FP8混合精度——MoE专家参数用FP4，其余用FP8——KV缓存的显存占用再砍一半。

两者叠加的效果，技术报告里给了两个数字：在1M token场景下，V4-Pro的单token推理FLOPs只有V3.2的27%，KV缓存用量只有10%。

换算过来，同等算力下能服务的长上下文并发量大概是原来的3到4倍。

Agent能力这次真的支棱起来了

V4另一个让我意外的点，是Agent能力。

官方说，在Agentic Coding评测中，V4-Pro已经达到当前开源模型最佳水平。内部员工实测反馈是：使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式。

划重点——接近的是非思考模式，跟Opus 4.6思考模式（就是那个会显示完整推理过程的版本）还有差距。但说实话，能做到这个程度已经很离谱了。

更具体的数字是：SWE Verified测试集80.6分，Claude Opus 4.6是80.8分，几乎打平。Terminal Bench 2.0是67.9分，GPT-5.4是68.5分，差距不到1个百分点。

Codeforces编程竞赛评分达到3206分，这个数字在已公开评测的开源模型里是最高的，甚至超过了GPT-5.4的3168分。

数学和STEM领域的表现同样炸裂。IMO答案评测89.8%，仅次于GPT-5.4的91.4%。HMM数学竞赛2026达到95.2%。

一句话概括：数学、代码、Agent三个维度，V4-Pro在开源领域已经没有任何对手。

定价这次真的杀疯了

说完成绩，再看看价格。

V4-Pro每百万tokens输入（缓存命中）1元，输出24元。V4-Flash每百万tokens输入（缓存命中）只要0.2元，输出2元。

这个定价什么概念？去年V3刚出的时候，DeepSeek就因为"价格屠夫"的定位被业内关注。这次V4等于把性价比优势继续保持，而且还把100万上下文这个曾经的高端功能打包进去了。

不过有个细节要提醒一下：目前V4-Pro的服务吞吐十分有限，官方在小字里写了，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调。

关于昇腾这件事，我多说两句。V4的技术报告里明确提到，细粒度专家并行方案同时在NVIDIA GPU和华为昇腾NPU上完成验证。这说明DeepSeek已经在为多算力环境做准备了——一边在现有CUDA生态内做极致优化，一边也在给华为等国产芯片预留空间。

对于国内开发者来说，这算是个好消息。毕竟去年昇腾910C适配DeepSeek的时候，因为稳定性问题导致分布式训练频繁崩溃，项目一度被迫退回英伟达GPU。从910C到950PR，DeepSeek花了整整一年多才解决这些问题。如果下半年昇腾950真的能批量上市，国产算力部署V4的可行性会大幅提升。

说实话，看完V4的技术报告和官方发布稿，我最大的感受是：DeepSeek这波操作，把"普惠"两个字刻进了产品的每一处设计里。

百万上下文免费可用、Agent能力对齐顶级闭源模型、价格继续保持杀伤力——而且还开源。

发布稿结尾DeepSeek自己引用了一句话，来自荀子《非十二子》："不诱于誉，不恐于诽，率道而行，端然正己。"

过去半年各种传言他们一次都没回应过。然后在某个周五下午，把V4放出来，同步开源，同步上线官网和App，同步更新API。

没有直播，没有访谈，没有PPT吹牛。

这个风格，我挺喜欢的。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

DeepSeek V4发布，万亿参数百万上下文，能否再次震撼AI行业

1个月前

一文读懂DeepSeek V4：用27%的算力打赢100%的战争

1个月前