定了，DeepSeek V4首发华为芯片！国产AI开始打破英伟达「垄断」-工信会

> 自媒体 > （AI）人工智能 > 定了，DeepSeek V4首发华为芯片！国产AI开始打破英伟达「垄断」

定了，DeepSeek V4首发华为芯片！国产AI开始打破英伟达「垄断」

来源：新浪财经

2026-05-07 16:54:42

318

管理

来源：市场资讯

（来源：爱范儿）

星期五中午，本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然反手就是一个超级加倍，就在刚刚，正式发布并开源了 V4 系列模型预览版。

参与内部调研的 85 名有使用经验的开发者和研究人员中，超过九成认为 V4-Pro 已经可以作为首选或接近首选的编程模型。

模型已针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 产品进行专项适配，代码任务与文档生成均有提升。

工具调用方面，V4 系列引入了新的 XML 格式 tool-call schema，以「|DSML|」特殊 token 划定调用边界。官方表示这一设计有效减少了转义失败和工具调用错误，比上一代更可靠。

日常任务用 Flash，遇到硬骨头开 Think Max，性价比很高。

模式之间的性能落差远比版本之间的落差大。以 V4-Pro 为例，HLE Pass@1 从非思考模式的 7.7 提升至 Max 模式的 37.7，Apex Pass@1 从 0.4 提升至 38.3，BrowseComp Pass@1 从无法评测跃升至 83.4。对于复杂任务，选对思考强度，比纠结选哪个版本要重要得多。

两款模型均支持三种推理强度，可通过 reasoning_effort 参数切换。

非思考模式响应速度快，适合日常轻量任务；Think High 开启显式逻辑推理，适合复杂问题与规划；Think Max 推理能力拉满，适合探索模型上限，官方建议上下文窗口至少设置为 384K token，复杂 Agent 场景则直接设成 max。

Think Max 模式下还有一段额外注入到系统提示开头的指令，要求模型「以绝对最大力度推理，不允许走捷径」，并强制要求把每一步推理、每一个被否定的假设都显式写出来。

这种设计的效果从数据上看相当明显，也解释了为什么同一个模型在不同模式下的表现差距如此之大。

百万长上下文，榨干每一个 token

百万 token 上下文有不少模型都在宣传，但撑起这个规模的工程代价是完全不一样的。

DeepSeek V4 在架构层面做了比较大的调整。注意力机制是这次改动的核心。传统的注意力计算量随序列长度平方增长，上下文一长就成了最主要的计算瓶颈。

他还假设了一个情况，那就是 DeepSeek 新模型在华为平台上首发，黄仁勋表示这一天对美国来说将是一个可怕的结果，因为这意味着 AI 模型被优化为在中国 AI 硬件上表现最佳，而这些模型扩散到全球之后，就会推动中国技术成为世界标准。

DeepSeek 用万亿参数级别的模型验证了昇腾可以承载顶级大模型的推理，这对整个国产算力生态是一针强心剂。国内大厂本就在加大昇腾芯片的采购力度，V4 的成功适配让这个决策有了更充分的技术背书。寒武纪、海光信息等其他国产芯片厂商也会被倒逼着加速自己的大模型适配进度。

一个顶级开源模型的芯片选择，正在撬动一整条产业链的洗牌。

DeepSeek-V4 模型开源链接：

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

DeepSeek-V4 技术报告：

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

DeepSeek V4：百万上下文的白菜价，够干多少真事？

1个月前

DeepSeek V4实测：普通人想玩本地部署，你的电脑显卡达标了吗？

1个月前