> 自媒体 > (AI)人工智能 > DeepSeek V4重磅发布,百万上下文成标配,华为昇腾率先适配!
DeepSeek V4重磅发布,百万上下文成标配,华为昇腾率先适配!
来源:CSDN
2026-04-28 15:51:37
161
管理

4 月 24 日的 AI 技术圈再次因大模型的升级而沸腾。

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

就在 OpenAI 于凌晨刚推出 版本之后的几个小时,国产大模型也迎来了重磅时刻——DeepSeek-V4 预览版官宣上线,并同步开源。

官方发布 58 页完整技术报告,让开源大模型迈入百万 token 高效上下文时代,彻底重构长文本大模型的效率与能力边界。

架构升级,关键技术创新大幅提高上下文效率

从技术架构层面来看,DeepSeek‑V4 没有停留在堆参数、扩数据的传统路线,而是从注意力机制、残差连接、优化器三大底层维度,进行了技术升级。

简单来看,与 DeepSeek-V3 架构相比,DeepSeek-V4 系列保留了 DeepSeekMoE 框架和多词元预测(MTP)策略,同时在架构和优化方面引入了多项关键创新:

采用混合注意力架构,将压缩稀疏注意力(CSA)和重压缩注意力(HCA)结合,用于提升长上下文处理效率。CSA 沿序列维度压缩键值缓存,然后执行 DeepSeek 稀疏注意力(DSA),而 HCA 对键值缓存应用更激进的压缩,但保持了密集注意力;

为了增强建模能力,DeepSeek 也在架构中引入了流形约束超连接(mHC),在传统残差连接基础上进一步增强信息传递能力;

以及 Muon 优化器被引入了 DeepSeek-V4 系列的训练中,用于加快收敛速度并提升训练稳定性。

在训练维度,DeepSeek 在超过 32T 高质量、多样化的 token 上对两个模型进行了预训练,并在此基础上引入了一整套完整的后训练流程,进一步增强模型能力。

同时,据技术报告显示,DeepSeek-V4 系列在长上下文场景下也表现出极高的效率。在百万 Token 的上下文设置下,DeepSeek-V4-Pro 仅需 DeepSeek-V3.2 的 27% 单 Token 推理 FLOP,KV cache 占用仅为 10%。

正因此,DeepSeek 能够将“百万 token 上下文”作为常规能力来支持,从而显著提升长时序任务的可行性,并为测试阶段的进一步扩展提供了空间。正如官方所说:“从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。”

算力支持

值得注意的是,对于行业最关注的国产算力落地,DeepSeek 在技术报告中指出,他们在 NVIDIA GPU 和华为 Ascend NPU 平台上,对细粒度 EP(Expert Parallelism)方案进行了验证。

另一方面,华为昇腾超节点系列产品也宣布全面支持,本次通过双方芯模技术紧密协同,实现异腾超节点全系列产品支持 DeepSeek V4 系列模型。

另外,DeepSeek 官方还提到,旧有的 API 接口的两个模型名 deepseek-chat 与deepseek-reasoner 将于三个月后(2026-07-24)停止使用。当前阶段内,这两个模型名分别指向 deepseek-v4-flash 的非思考模式与思考模式。

普通用户可直接登录 DeepSeek 官网或官方 App,体验 100 万 Token 上下文带来的震撼能力:一次性上传整本书、整个项目代码、整份合同文档,实现真正的 “一次性读懂、全程记忆、深度推理”。

DeepSeek‑V4 的到来,不只是一次模型升级,更是开源大模型进入 “百万上下文高效时代” 的标志。它用架构创新证明:超长上下文不必靠暴力算力,小激活参数也能拥有顶级推理。

开源地址:

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

技术报告:

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

「粉丝专属回馈:60 顶级大厂 AI 实战 PPT 限时领!」

2026 奇点智能技术大会·上海站圆满落幕!整整两天,CSDN 与奇点智能研究院携手,把“AI 正在如何重塑软件开发”彻底摊开讲透了。

这不仅仅是一场会议,更是一份关于未来的答案。从 NVIDIA、微软、Google 的全球视野,到华为、阿里、腾讯、京东、网易、快手、昆仑万维的本土实践;从月之暗面、阶跃星辰、MiniMax 的独角兽洞察,再到北大、智源、奇点智能研究院的前沿探索。

Agent 正在成为新入口,软件形态正在被重写。

错过了现场?没关系!为回馈粉丝,我们特将本次大会的高质量演讲 PPT 完整打包。

领取方式: 在公众号后台私信发送 「奇点」 二字,即可一键获取全套干货。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
舞月(普通会员)
文章
1907
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105719

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索