黄仁勋没想到,自己刚说完“如果”,“如果”就被DeepSeek变成了现实。
据报道,英伟达CEO黄仁勋4月15日接专访时表示,DeepSeek绝非无关紧要的进步。如果DeepSeek先在华为平台上发布,那对美国来说将是一个可怕的结果。
他进一步解释说,假设它是针对华为优化的,针对他们的架构优化了,那就会让我们处于劣势。
不到10天,4月24日,DeepSeek V4预览版正式发布并开源,华为同步宣布昇腾超节点全系列产品支持DeepSeek V4系列模型。黄仁勋口中的“如果”,成了实实在在的现实。

黄仁勋
DeepSeek在技术报告中首次将华为昇腾NPU与英伟达GPU并列验证,把专家并行方案同时在两种硬件上跑通,并公布了性能数据,其中,在英伟达GPU和华为昇腾NPU上均实现了1.5至1.73倍加速。
而V4采用FP4加FP8混合精度训练,FP4恰好是华为昇腾950PR原生支持的格式,DeepSeek的工程团队更是在华为自研的CANN框架上完成了完整适配。
这意味着,DeepSeek从模型架构设计阶段,就把华为芯片的特性考虑进去了,属于联合深度适配。

华为芯片
这就是黄仁勋认为的最可怕的场景,他为什么害怕呢?
逻辑很简单,英伟达真正害怕的从来不是中国做出好模型,而是好模型不再基于CUDA生态。
英伟达现在最大的护城河,就是CUDA软件生态。
几乎所有主流AI框架、算子库、开源模型的首发优化,都默认以CUDA为起点。
谷歌的TPU,AMD的ROCm,都试图挑战,但都没能挑战成功。
因为开发者已经习惯了CUDA,模型已经长在了CUDA上。
只要这条护城河还在,英伟达就可以无限卖铲子。
而现在,DeepSeek V4原生支持华为芯片,不再以CUDA为默认起点,这意味着头部模型厂商开始具备脱离单一算力生态的能力。

中美芯片博弈
黄仁勋当然清楚这意味着什么,以前的垄断生意,现在没法垄断了,失去的还是最大客户。
他为了能把芯片卖到中国也是煞费苦心,没少在特朗普身上砸钱,结果芯片还没卖出去,中企就已经找到了替代选项。
诚然,华为昇腾910C的推理性能大约是英伟达H100的百分之六十,美国芯片的算力大约是中国芯片的五倍,客观差距仍然存在。
但是,当顶级模型已经被优化到能在这些不如英伟达的芯片上高效运行时,这个差距的意义就被大幅稀释了。
你的芯片确实更快,但我的模型根本不需要你的芯片也能达到足够好的效果,那你的更快的芯片卖给谁去?
所以黄仁勋说可怕,一点都没错。可怕的不是DeepSeek V4有多强,是一个不需要美国芯片也能运转的AI世界,正在从概念变成现实。
英伟达花了二十年建起的CUDA生态壁垒,被一家中国AI公司和一家被美国制裁了多年的中国硬件企业联手破解了。
回头看,黄仁勋之前的预告,更像是一声叹息,他肯定知道这一天早晚会来,只是没想到会来得那么快,那么干脆。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105620