> 自媒体 > (AI)人工智能 > DeepSeek V4延迟145天发布:三重“大手术”如何突破AI瓶颈?
DeepSeek V4延迟145天发布:三重“大手术”如何突破AI瓶颈?
来源:极简科技
2026-05-10 09:37:10
118
管理

2025年12月,DeepSeek发布了V3.2版本。接下来的145天里,AI世界风起云涌:OpenAI推出了GPT-5,Anthropic发布了Claude Opus 4.7,国内的Kimi也上线了K2.6。然而,那个曾经以快速迭代惊艳众人的DeepSeek,却像按下了静音键,再没有发布任何新模型。

直到2026年4月24日,V4预览版才终于上线。这145天的“沉默”并非研发停滞,而是一场同时进行的三重“大手术”——给一辆高速行驶的赛车更换发动机、重构动力系统,并且还要同步铺设一条全新的专用赛道。

第一台手术:万米高空,给赛车换“中国心”

V4延迟最核心、最耗时的原因,是从英伟达的CUDA生态,全面转向华为昇腾平台。这远不是简单的“换零件”。

想象一下:你一直用一套成熟的乐高积木(CUDA)设计和测试赛车。现在,有人给你一套全新的、内部结构完全不同的积木(昇腾CANN框架),要求你用这套新积木,把赛车原样复刻出来,并且性能不能下降。

你面临的不是“拼装”,而是从零开始重新理解设计图纸、重制每一个连接件、验证每个模块的稳定性。

这就是DeepSeek团队在2025年底到2026年初的真实处境。从CUDA迁移到昇腾,需要重写90%到100%的底层计算算子,并解决硬件架构差异带来的精度对齐等难题。这个过程被业内形容为 “万米高空换发动机” 。

仅仅这一项全栈重构,就消耗了大约3到4个月的研发时间。

为何要做如此艰难的选择?因为外部技术封锁加剧,依赖英伟达芯片的风险越来越高。转向昇腾,意味着中国顶级大模型首次证明了万亿参数模型可以完全脱离英伟达生态运行。英伟达CEO黄仁勋在V4发布前曾直言,如果DeepSeek在华为平台上首发,“对美国来说将是一场灾难”。

这场“换心手术”,是中国AI构建自主可控算力底座的关键一步。

第二台手术:从“通才教育”到“专家会诊”

如果说换芯片是硬件层的大手术,那么V4在模型训练方法上的变革,则是一次彻底的“大脑重组”。

V3.2采用的是一种叫“混合强化学习(RL)”的方法。这好比让一个学生同时猛攻数学、语文、英语、编程等多门功课,目标是培养一个全能通才。但问题在于,同时优化多个目标容易导致能力互相干扰——强化数学可能损害代码能力,优化写作又可能影响逻辑推理。

V4彻底放弃了这条路线,转而采用“多专家独立训练 策略蒸馏(OPD)”的全新方案。新方法分为两步:

第一步:培养顶尖专家。分别训练数学专家、代码专家、智能体(Agent)专家等,让每个专家在各自的细分领域里做到最好。第二步:知识融合。用一个“学生模型”去学习、模仿所有专家的思考和输出方式,把他们的顶尖能力“蒸馏”融合进一个统一的模型里。

这就像先培养出顶级的数学家、顶尖的程序员和卓越的谈判专家,再创造一个能综合他们所有思维模式的“超级大脑”。这种方法从根本上解决了能力干扰问题,但代价是训练流程更长、工程复杂度极高——需要设计复杂的系统,让“学生”能同时向多位“老师”学习,而不至于内存崩溃。

第三台手术:一边比赛,一边修新赛道

在进行上述两项核心手术的同时,DeepSeek还在同步推进大规模基础设施的搭建。

为了训练更强大的智能体(Agent),他们自建了名为 DSec的沙箱平台,单集群就能管理数十万个独立运行环境,专门支撑海量Agent的强化学习训练。

此外,团队还要完成与华为、寒武纪、海光信息等至少7家国产芯片厂商的“Day0”适配,确保模型发布当天就能在这些国产芯片上运行。

这相当于赛车团队在研发新车、培训车手的同时,还在联合多家厂商,从零开始修建一条全新的、技术标准更高的F1赛道。

“慢工出细活”的基因,与追赶顶尖的执念

除了上述三重挑战,DeepSeek自身的研发基因也决定了其较长的迭代周期。

不追求快节奏商业化:与国内一些厂商每2-3个月迭代一次的频率不同,DeepSeek历来坚持 1到1.5年 的发布周期。他们更注重技术深度积累,而非短期商业变现。发布前追加优化:据界面新闻报道,V4模型其实早已训练完成,内部评估其水平大约对标当时的Opus 4.5或GPT-5.3 Code X。但团队为了“再追一追”国际顶尖闭源模型的水平,又投入了额外时间进行优化,这直接导致了发布延期。

所以,DeepSeek V4的145天,远非简单的“跳票”。这是一家技术驱动型公司,在外部环境倒逼下,选择了一条最艰难但可能也最正确的路:在飞行中更换引擎,在竞争中重构大脑,并为整个产业生态修建新的基础设施。

这145天的沉默,换来的不仅是一个更强大的模型,更是中国AI在算力自主道路上一次标志性的突破。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
微信又上线新功能,聊天突然变了!
近日,微信突然因内测“访客记录”功能,引发全网关注。被内测到的用户,..
元宝可以总结微信聊天记录了
作者 | 黄昱元宝终于拆掉了微信最高的围墙。5月13日,腾讯旗下AI原生应用..
刚刚,微信聊天记录能喂给AI了!我让它爬楼、砍价、整理信息..
智东西作者 | 陈骏达编辑 | 心缘智东西5月13日报道,今天,腾讯宣布,微..
微信聊天出新功能了,快试试!
但要求你的手机安装有元宝App,这时就会跳转到元宝中进行粘贴,你可以发..
不用登你的微信,也能看到你的聊天记录!这几个地方一定赶紧删除..
你知道吗?其实不用登你的微信,也能看到你的聊天记录,是不是太可怕了?..
刚刚,微信聊天记录能喂给AI了,我让它爬楼、砍价、整理信息..
智东西5月13日报道,今天,腾讯宣布,微信已经支持将消息一键转发至元宝..
聊天总把天聊死?这7个雷区,你可能正在踩。如何正确和女生聊天..
明明聊得火热,为什么突然被拉黑?你可能踩中了这七个聊天雷区“在吗?”..
用ChatGPT看病,80%误诊:AI医生的9秒奇迹和80%的残酷真相..
9秒出CT报告,1分钟完成心脏诊断——AI医疗看起来像魔法。但哈佛刚说完:..
突发!OpenAI高层巨震,ChatGPT与CodeX或合并,超级AI来了!..
根据《连线》5 月 15 日的独家报道,在最新一轮组织调整中,OpenAI 总裁 ..
关于作者
月深沉(普通会员)
文章
2048
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110233

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索