联手华为！DeepSeek V4改写中国AI底座！-工信会

> 自媒体 > （AI）人工智能 > 联手华为！DeepSeek V4改写中国AI底座！

联手华为！DeepSeek V4改写中国AI底座！

来源：正商参阅

2026-05-02 09:27:23

132

管理

作者：AI科技锐评

来源：AI科技锐评（ID：AIreview001）

DeepSeek V4发布即刷屏！

成本暴降，百万上下文，Agent增强，联手华为、寒武纪适配国产算力……

它正在告诉市场：大模型竞争已经不再只是榜单竞争，而是开始进入更残酷的成本效率竞争、算力适配竞争和生态入口竞争。

低成本高质量，才是未来企业正在需要的。毕竟企业真正需要的，不是每一次请求都调用最贵、最强的模型，而是在不同任务之间找到能力、成本和响应速度的平衡点。

DeepSeek开始把模型做成一组可调度、可分层、可商业化组合的AI基础设施。

成本暴降73%

在100万token上下文设置下，DeepSeek-V4-Pro相比DeepSeek-V3.2，单token推理FLOPs只需要27%，KV Cache只需要10%。

换句话说，也就是长上下文推理中的计算量压力大幅下降；KV Cache只剩10%，意味着显存和缓存压力也被明显压缩。

过去大家讨论长上下文，很容易只看“能不能放进去”，100万token听起来很震撼，但真正的问题不是能不能塞进去，而是塞进去之后还能不能高效地算、稳定地跑、便宜地用。

上下文越长，推理成本、显存占用、响应延迟都会迅速放大。

尤其是在企业场景里，模型需要读合同、读代码库、读制度文件、读会议纪要、读历史工单。

一次任务不只是问一句话，而是连续读取、理解、规划、执行、修正。

如果长上下文成本下不来，Agent就只能停留在演示视频里。

所以V4这次主攻的就是在100万token场景下继续压低计算压力。

毕竟模型能力越强，调用越频繁，成本控制越重要。

AI不再只是“能不能用”的问题，而是“能不能每天用、多人用、长期用、低成本用”的问题。

谁能把单位推理成本压得更低，谁就更接近真实的规模化入口。

让Agent更像工作系统

100万上下文真正改变的是Agent的工作边界。

DeepSeek API文档显示，V4-Flash和V4-Pro均支持1M上下文，最大输出可达384K，并支持JSON Output、Tool Calls、Chat Prefix Completion等能力。

这些功能指向的是一个更明确的方向：DeepSeek不是只想做聊天模型，而是在继续向任务型模型、工具型模型、Agent底座推进。

对企业来说，长上下文意味着什么？

对代码场景，它可以一次性理解更大范围的代码库、需求文档和历史修改记录。

对金融、法律、咨询场景，它可以处理更长的研报、合同、纪要、制度文件和客户材料；

对知识库场景，它可以减少过度切片、错误召回、上下文断裂带来的信息损耗；

对于Agent场景，它可以让模型在更长任务链条里保持连续性，不至于走几步就忘记前因后果……

这才是百万上下文真正的商业含义，它不是让AI多背一点东西，而是让企业流程第一次有机会被更完整地交给模型处理。

过去很多AI应用看起来很聪明，但一到真实工作流就掉链子。原因很简单：真实工作不是单点问答，而是一组连续任务。

而Agent要变成生产系统，首先得具备连续工作的能力。

DeepSeek V4这次把长上下文、工具调用、结构化输出放在同一条线上，说明它要抢的已经不是聊天入口，而是企业流程里的执行入口。

联手华为，底座开始换代

路透社4月24日报道称，华为表示，基于昇腾950 AI芯片的Ascend supernode将全面支持DeepSeek V4系列模型。

这是里程碑式的节点，说明中国的模型公司和算力公司开始进入更深层的协同优化。

过去，无论训练、推理、部署、工具链，“英伟达”都处在产业链的核心位置。

但到了V4这一轮，情况开始发生变化。

当模型开始为国产芯片、国产软件栈、国产集群做适配，AI竞争就不再只是算法团队之间的比赛，而是模型、芯片、编译器、推理框架、开发者生态之间的系统协同。

这才是属于中国的“强强联手”！

据华为2025年年报显示，公司实现全球销售收入8809亿元人民币，净利润680亿元人民币；2025年研发投入达到1923亿元，占全年收入21.8%，近十年累计研发投入超过1.382万亿元。华为押注AI计算，不是一次短期热点跟进，而是长期研发投入和产业生态建设的结果。

DeepSeek V4如果能在昇腾体系上跑得更稳、更便宜、更可规模化，就不只是DeepSeek自己的胜利，也是在验证国产AI算力能否承接下一代模型应用。

未来国产算力公司比拼的不会只是芯片峰值性能，而是谁能更快适配模型，谁的软件栈更稳定，谁能支撑企业级推理服务，谁能在开发者生态里站住位置。

芯片只是起点；能用起来，才是门槛；能被反复调用，才是价值。

价格战之后是“生态战”

R1时代，DeepSeek已经让全球AI行业重新审视中国模型的成本效率，到了V4，DeepSeek并没有放弃这张牌，而是开始把低价策略做得更分层。

根据DeepSeek API文档，V4-Flash每百万token价格为：缓存命中输入0.028美元，缓存未命中输入0.14美元，输出0.28美元；V4-Pro对应为：缓存命中输入0.145美元，缓存未命中输入1.74美元，输出3.48美元。

V4-Flash继续承担低成本入口，适合大量高频、通用、响应速度敏感的场景；

V4-Pro则承担复杂任务和高价值调用，价格明显更高，但也提供更强的推理、长上下文和Agent能力。

这说明DeepSeek已经不是简单做“价格屠夫”，它正在从单一低价策略，转向“能力分层价格分层场景分层”。

当开发者、企业客户、云厂商、芯片厂商、Agent平台都围绕一个模型系列搭建流程时，竞争就不再只是一次API调用的价格，而是谁能成为默认选项。

AI行业最终比的不是一次发布时的热度，而是谁能嵌入更多应用、更多工具、更多工作流。

DeepSeek V4的真正野心，可能不是再造一个“最强聊天机器人”，而是成为中国AI应用生态里的底层接口之一。

V4是否可以封神？

虽然模型榜单很重要，但企业真正关心的是另外一组指标：

延迟、稳定性、并发能力、SLA、工具调用准确率、私有化部署成本、安全合规，以及在复杂业务流程中的可控性。

再强的模型，如果频繁超时、调用不稳、工具执行出错，企业仍然很难大规模使用。

华为、寒武纪的适配是关键进展，但开发者生态、框架兼容、集群调度、推理效率、故障定位、工程工具链，都需要长期验证。

真正的产业替代，不是靠一句口号完成的，而是在一次次模型更新、一次次客户部署、一次次复杂任务运行中磨出来的。

所以，V4真正的考场不在发布当天，而在接下来的几个月。

它能不能稳定服务开发者？

能不能支撑复杂Agent任务？

能不能在国产算力上跑出足够好的效率？

能不能让企业愿意长期调用？

这些问题，比“刷屏”更重要。

AI下半场，拼的是稳定交付

回头看DeepSeek这一年，它最重要的作用，不只是做出了强模型，而是不断改变行业的计分方式。

过去，大模型行业喜欢比参数、比榜单、比发布会震撼程度。

DeepSeek出现后，大家开始更认真地讨论训练成本、推理成本、开源效率、模型蒸馏、国产算力适配。

这一次V4继续往前推了一步。它让行业看到，下一阶段AI竞争至少有四个核心变量：

1.模型能力还要继续提升：没有能力，其他都没有意义。

2.推理成本必须继续下降：成本降不下来，Agent和企业应用都难以规模化。

3.上下文和工具调用要走向生产级：模型不能只会聊天，还要能理解流程、调用工具、完成任务。

4.算力底座要形成可替代路径：如果模型能力始终被单一硬件生态锁住，中国AI的自主性就始终不完整。

这四个变量合在一起，才是DeepSeek V4真正释放的信号，它不是一次孤立的模型升级，而是中国AI开始围绕成本、算力、工具链和生态重新组织竞争。

毕竟AI下半场，单点突破可能不够了。

真正的竞争会落到更具体的地方：单位推理成本、算力调度效率、软件栈成熟度、开发者迁移成本、企业长期调用意愿。

DeepSeek V4在提醒整个行业：AI的胜负，正在从“谁更聪明”，变成“谁能把聪明稳定、便宜、可复制地交付出去”。

— 完 —

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

周末，DeepseekV4第一轮测评来了！港股通恒生科技ETF（520840）DeepSeek概念超73%，早盘小幅上扬

1小时前

高盛：DeepSeek V4对中国AI意味着什么？

1小时前