推理成本仅GPT-5.5的1/70，DeepSeek V4发布，标配百万上下文破CUDA锁-工信会

> 自媒体 > （AI）人工智能 > 推理成本仅GPT-5.5的1/70，DeepSeek V4发布，标配百万上下文破CUDA锁

推理成本仅GPT-5.5的1/70，DeepSeek V4发布，标配百万上下文破CUDA锁

来源：清闲的星球VAypRw

2026-06-10 11:21:47

139

管理

> 2026年4月24日，杭州深度求索公司发布并开源DeepSeek V4系列AI大模型，标配百万级上下文输入，推理成本仅为GPT-5.5的七十分之一。![](blockview://markdown-image-tos-cn-i-tt/cd695615dd8e416d98d605389157e719)这一技术突破与随之而来的永久降价策略，不仅挑战了海外巨头的市场地位，更通过虚拟硬件层设计打破了英伟达CUDA的软件锁定，将华为昇腾、寒武纪等国产芯片变为“无差异的标准算力单元”。在国产大模型周调用量已连续数周超越美国模型的背景下，DeepSeek的崛起正重新定义AI产业的游戏规则。## 技术突破：百万上下文与成本骤降DeepSeek V4系列采用混合专家模型架构，总参数约1.6万亿，但每次推理仅激活少量参数，大幅压缩计算资源消耗。其核心创新在于高效处理长文本：在**100万token上下文**场景下，KV Cache仅占5.48GB HBM，而同类模型如GLM5需60GB、Qwen3需89GB。这种设计将长上下文从“显存黑洞”转化为可压缩的系统工程，使模型推理能更多依赖SSD、NAND闪存等廉价存储介质，降低对昂贵HBM和英伟达GPU的依赖。- **成本优势**：训练V3的总成本约560万美元，仅为GPT-4估算成本的约1/18。- **推理效率**：V4-Pro处理超长文本时，单次计算量降至上一代的27%，内存占用缩减到10%。## 虚拟硬件层：打破CUDA锁定V4版本最颠覆性的突破是引入**虚拟硬件层**，这相当于在AI平台构建了一个通用操作系统。DeepSeek完成了从CUDA到全栈异构的重构，重写了200多个核心计算单元，核心代码同时兼容CUDA、CANN、ROCm，摆脱了对CUDA算子的依赖。![](blockview://markdown-image-tos-cn-i-tt/91b9da5913e04d75ac445d7a06f94399)业界形容此难度“像在万米高空换飞机发动机”。> “有了虚拟硬件层，软件开发可以最大限度地脱离对底层芯片的依赖，模型无需修改核心代码，就可以在任意芯片上高效运行。”V4发布当天，华为昇腾、寒武纪、海光等**8家国产AI芯片厂商**同步宣布完成全链路适配。华为昇腾950芯片实现20毫秒超低延迟推理，单卡吞吐量达4700TPS。![](blockview://markdown-image-tos-cn-i-tt/5633f50531ac4c2faad2013a63322525)## 性能对标：全球性价比榜首第三方评估显示，DeepSeek-V4-Pro完成AI智能指数基准测试仅需268美元，而GPT-5.5和Claude Opus 4.7的成本分别为其12倍和19倍。在性能上，V4-Pro在多个领域比肩全球顶级闭源模型：- **Agent能力**：在Agentic Coding测评中达到开源模型最佳水平，使用体验优于闭源的Claude Sonnet 4.5。- **世界知识**：大幅领先其他开源模型，仅次于谷歌Gemini-3.1-Pro。- **专业领域**：在数学、STEM、竞赛型代码测评中超越所有已公开评测的开源模型。## 商业策略：降价与500亿融资5月22日，DeepSeek宣布V4-Pro模型API永久降价75%，输入token价格降至每百万0.435美元，缓存命中低至0.0036美元。此后，小米跟进旗下MiMo系列最高降价99%，腾讯云对DeepSeek-V4系列模型调用价格最高下调97.5%。降价背后是技术迭代带来的成本下降，而非单纯价格战。同时，DeepSeek启动首轮外部融资，拟募资约**500亿元**，投后估值达3500亿至4000亿元。融资细节显示：- 创始人梁文锋个人出资200亿元，占40%。- 腾讯计划出资100亿元，宁德时代计划出资50亿元。- 国家人工智能产业投资基金、网易、京东等也在谈判名单中。资金将聚焦算力基建、国产芯片适配及人才绑定。宁德时代的参与旨在探索AI数据中心电力设备和储能解决方案。## 产业涟漪：国产芯片与算力普惠DeepSeek的技术选择催生了正向循环：降低对顶级硬件的依赖，让更多国产硬件厂商参与竞争，从而支撑更低API价格，吸引更多开发者和应用，最终扩大推理负载。这推动了算力普惠，赋能中小企业。- **中小企业受益**：“过去只有头部企业才用得起AI，如今中小企业、传统制造业等都能用上了。”- **研发效率提升**：AI工具成为企业研发“得力助手”，模型迭代周期从月、周压缩到天。- **民生应用拓展**：智能理赔、精准风控等以往成本不划算的业务有望成为可能。中国大模型周调用量已达**9.22万亿Token**，美国模型为4.93万亿Token，中国整体连续数周稳居全球榜首。## 从跟跑到领跑：中国AI的新逻辑DeepSeek V4的发布标志着中国AI产业从“做产品”向“做行业领导者、做生态标准”的历史性跳跃。通过开源策略、低价API和技术共享，DeepSeek正构建自主可控的产业竞争新逻辑。随着国产芯片加速成熟和“算力银行”等共享调度模式兴起，基础算力成本有望继续下降，激发更多数字经济发展潜力。这场由技术突破驱动的变革，不仅重塑了全球AI格局，更为中国在全球科技竞赛中提供了从跟跑到领跑的底气。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

同行纷纷涨价，DeepSeek 却永久降价 75%，重塑大模型行业竞争格局

3小时前

10-多维表格 DeepSeek 字段捷径攻略：常见报错、账号配置与联网

3小时前