> 自媒体 > (AI)人工智能 > 定了,DeepSeek V4首发华为芯片!国产AI开始打破英伟达「垄断」
定了,DeepSeek V4首发华为芯片!国产AI开始打破英伟达「垄断」
来源:新浪财经
2026-05-07 16:54:42
166
管理

来源:市场资讯

(来源:爱范儿)

星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然反手就是一个超级加倍,就在刚刚,正式发布并开源了 V4 系列模型预览版。

参与内部调研的 85 名有使用经验的开发者和研究人员中,超过九成认为 V4-Pro 已经可以作为首选或接近首选的编程模型。

模型已针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 产品进行专项适配,代码任务与文档生成均有提升。

工具调用方面,V4 系列引入了新的 XML 格式 tool-call schema,以「|DSML|」特殊 token 划定调用边界。官方表示这一设计有效减少了转义失败和工具调用错误,比上一代更可靠。

日常任务用 Flash,遇到硬骨头开 Think Max,性价比很高。

模式之间的性能落差远比版本之间的落差大。以 V4-Pro 为例,HLE Pass@1 从非思考模式的 7.7 提升至 Max 模式的 37.7,Apex Pass@1 从 0.4 提升至 38.3,BrowseComp Pass@1 从无法评测跃升至 83.4。对于复杂任务,选对思考强度,比纠结选哪个版本要重要得多。

两款模型均支持三种推理强度,可通过 reasoning_effort 参数切换。

非思考模式响应速度快,适合日常轻量任务;Think High 开启显式逻辑推理,适合复杂问题与规划;Think Max 推理能力拉满,适合探索模型上限,官方建议上下文窗口至少设置为 384K token,复杂 Agent 场景则直接设成 max。

Think Max 模式下还有一段额外注入到系统提示开头的指令,要求模型「以绝对最大力度推理,不允许走捷径」,并强制要求把每一步推理、每一个被否定的假设都显式写出来。

这种设计的效果从数据上看相当明显,也解释了为什么同一个模型在不同模式下的表现差距如此之大。

百万长上下文,榨干每一个 token

百万 token 上下文有不少模型都在宣传,但撑起这个规模的工程代价是完全不一样的。

DeepSeek V4 在架构层面做了比较大的调整。注意力机制是这次改动的核心。传统的注意力计算量随序列长度平方增长,上下文一长就成了最主要的计算瓶颈。

他还假设了一个情况,那就是 DeepSeek 新模型在华为平台上首发,黄仁勋表示这一天对美国来说将是一个可怕的结果,因为这意味着 AI 模型被优化为在中国 AI 硬件上表现最佳,而这些模型扩散到全球之后,就会推动中国技术成为世界标准。

DeepSeek 用万亿参数级别的模型验证了昇腾可以承载顶级大模型的推理,这对整个国产算力生态是一针强心剂。国内大厂本就在加大昇腾芯片的采购力度,V4 的成功适配让这个决策有了更充分的技术背书。寒武纪、海光信息等其他国产芯片厂商也会被倒逼着加速自己的大模型适配进度。

一个顶级开源模型的芯片选择,正在撬动一整条产业链的洗牌。

DeepSeek-V4 模型开源链接:

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

DeepSeek-V4 技术报告:

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
AI for Science 会有 “ChatGPT 时刻” 吗?年轻人该如何下注?..
来源:市场资讯(来源:网易科技)编者按当 AI 正在重构科研与产业的底层..
幻觉减半,废话砍三成!被骂一年,OpenAI 终于把 ChatGPT 改对了..
来源:市场资讯(来源:AI信息Gap)GPT-5.5 Instant,上线了。替换掉了 G..
DeepSeek 又改了”常识”:这次他们教 AI 像人一样”看书”..
DeepSeek最新论文《DeepSeek-OCR 2: Visual Causal Flow》颠覆了OCR领域..
国资被曝领投DeepSeek首轮融资,梁文锋缺钱了吗?
5月6日,有消息称,国家集成电路产业投资基⾦正在洽谈领投DeepSeek(深度..
DeepSeek V4高调发布 美国:不能让世界建立在中国的开源模型之上..
2026年四月底,DeepSeek突然放出V4预览版,这事直接冲进全球科技圈的热搜..
“又要被降维打击了”:DeepSeek V4开源,为什么懂行的人都在慌?..
DeepSeekV4开源,不是来送温暖的,是来重新发牌的。70B参数以上的模型,..
DeepSeek V4实测:普通人想玩本地部署,你的电脑显卡达标了吗?..
现在很多普通人用AI,普遍都有一个很迷惑的现状。一边是各大平台网页版A..
详解 DeepSeek V4:Infra 巨鲸 “四连击”,百万上下文走进现实..
系统级耦合优化比单点创新更难。访谈丨程曼祺整理丨付自文、李清旸上周五..
美国慌了!DeepSeekV4打破垄断,AI价格打骨折,普通人也能用得起..
最近AI圈爆出天大新闻——DeepSeekV4正式发布了!它的出现,可不是简单的..
关于作者
雷振杍(普通会员)
文章
1971
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107722

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索