> 自媒体 > (AI)人工智能 > 扒外卖时收到DeepSeek V4发布消息,我用完后的真实感受
扒外卖时收到DeepSeek V4发布消息,我用完后的真实感受
来源:炎上世间妖邪
2026-04-28 21:29:47
30
管理

今天中午,我正在扒外卖的时候,手机突然震了一下。

群里有人甩了个链接,说DeepSeek V4发布了。

我第一反应是——假的吧?毕竟过去半年关于V4跳票、难产、被别家超越的传言跑了好几轮,年初还有人信誓旦旦说春节前发,结果等到四月底都没动静。

结果点开一看,卧槽,是真的。

4月24日,DeepSeek V4预览版正式上线,同步开源。一口气发了两个版本:Pro版1.6万亿参数、激活490亿;Flash版2840亿参数、激活130亿。两个版本都支持100万token上下文,而且从今天开始,1M上下文直接成了DeepSeek所有官方服务的标配。

说实话,这个操作有点离谱。

一年前,100万上下文还是Gemini独家的王牌。其他闭源模型要么128K要么200K,开源这边几乎没人玩得起这个量级。现在DeepSeek直接把百万上下文从一个"高端功能"挪成了"水电煤",而且还开源。

他们怎么做到的?我翻了一下技术报告,发现答案藏在底层架构里。

拆开看:V4的注意力机制到底干了什么

标准Transformer的自注意力,要让每个token跟序列里所有其他token算相关性权重。这是平方复杂度——序列翻倍,算力变四倍。处理100万token在传统架构下几乎无法商业化。

V4的方案是CSA加HCA混合注意力架构。

CSA(压缩稀疏注意力)解决的是"算什么"的问题。用轻量级索引器先对所有token对做粗筛,快速估算相关性排序,再精选出需要完整计算的token集合。这套稀疏结构是可训练的——模型在训练过程中自己学出哪里需要高密度注意力,哪里可以稀疏。半年前V3.2-Exp首次引入DSA的时候,外界关注度不高,因为跑分看起来没什么亮点。现在回头看,那是V4的地基。

HCA(重度压缩注意力)解决的是"存什么"的问题。在V3时代MLA多头潜在注意力的基础上继续推进,把KV向量映射到低维潜空间,推理时解压。叠上FP4加FP8混合精度——MoE专家参数用FP4,其余用FP8——KV缓存的显存占用再砍一半。

两者叠加的效果,技术报告里给了两个数字:在1M token场景下,V4-Pro的单token推理FLOPs只有V3.2的27%,KV缓存用量只有10%。

换算过来,同等算力下能服务的长上下文并发量大概是原来的3到4倍。

Agent能力这次真的支棱起来了

V4另一个让我意外的点,是Agent能力。

官方说,在Agentic Coding评测中,V4-Pro已经达到当前开源模型最佳水平。内部员工实测反馈是:使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。

划重点——接近的是非思考模式,跟Opus 4.6思考模式(就是那个会显示完整推理过程的版本)还有差距。但说实话,能做到这个程度已经很离谱了。

更具体的数字是:SWE Verified测试集80.6分,Claude Opus 4.6是80.8分,几乎打平。Terminal Bench 2.0是67.9分,GPT-5.4是68.5分,差距不到1个百分点。

Codeforces编程竞赛评分达到3206分,这个数字在已公开评测的开源模型里是最高的,甚至超过了GPT-5.4的3168分。

数学和STEM领域的表现同样炸裂。IMO答案评测89.8%,仅次于GPT-5.4的91.4%。HMM数学竞赛2026达到95.2%。

一句话概括:数学、代码、Agent三个维度,V4-Pro在开源领域已经没有任何对手。

定价这次真的杀疯了

说完成绩,再看看价格。

V4-Pro每百万tokens输入(缓存命中)1元,输出24元。V4-Flash每百万tokens输入(缓存命中)只要0.2元,输出2元。

这个定价什么概念?去年V3刚出的时候,DeepSeek就因为"价格屠夫"的定位被业内关注。这次V4等于把性价比优势继续保持,而且还把100万上下文这个曾经的高端功能打包进去了。

不过有个细节要提醒一下:目前V4-Pro的服务吞吐十分有限,官方在小字里写了,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

关于昇腾这件事,我多说两句。V4的技术报告里明确提到,细粒度专家并行方案同时在NVIDIA GPU和华为昇腾NPU上完成验证。这说明DeepSeek已经在为多算力环境做准备了——一边在现有CUDA生态内做极致优化,一边也在给华为等国产芯片预留空间。

对于国内开发者来说,这算是个好消息。毕竟去年昇腾910C适配DeepSeek的时候,因为稳定性问题导致分布式训练频繁崩溃,项目一度被迫退回英伟达GPU。从910C到950PR,DeepSeek花了整整一年多才解决这些问题。如果下半年昇腾950真的能批量上市,国产算力部署V4的可行性会大幅提升。

说实话,看完V4的技术报告和官方发布稿,我最大的感受是:DeepSeek这波操作,把"普惠"两个字刻进了产品的每一处设计里。

百万上下文免费可用、Agent能力对齐顶级闭源模型、价格继续保持杀伤力——而且还开源。

发布稿结尾DeepSeek自己引用了一句话,来自荀子《非十二子》:"不诱于誉,不恐于诽,率道而行,端然正己。"

过去半年各种传言他们一次都没回应过。然后在某个周五下午,把V4放出来,同步开源,同步上线官网和App,同步更新API。

没有直播,没有访谈,没有PPT吹牛。

这个风格,我挺喜欢的。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
大男孩(普通会员)
文章
1994
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105789

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索