> 自媒体 > (AI)人工智能 > DeepSeekV4预览版本正式发布
DeepSeekV4预览版本正式发布
来源:大象新闻
2026-04-28 16:41:45
41
管理

“不诱于誉,不恐于诽,率道而行,端然正己。”

在DeepSeekV4预览版本上线当天,DeepSeek官方团队表示:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。”

DeepSeek表示:“我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”

这些表态,似乎也是对近期传言的回应。4月24日,澎湃新闻记者获悉,外界关注的全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:

API服务已同步更新,通过修改model_name为deepseek-v4-pro或deepseek-v4-flash即可调用。

相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在AgenticCoding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。目前DeepSeek-V4已成为公司内部员工使用的AgenticCoding模型,据评测反馈使用体验优于Sonnet4.5,交付质量接近Opus4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。

DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

值得注意的是,DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeekSparseAttention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

DeepSeek-V4针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。

目前,DeepSeekAPI已同步上线V4-Pro与V4-Flash,支持OpenAIChatCompletions接口与Anthropic接口。访问新模型时,base_url不变,model参数需要改为deepseek-v4-pro或deepseek-v4-flash。

DeepSeek官方提供的模型价格

V4-Pro与V4-Flash最大上下文长度为1M,均同时支持非思考模式与思考模式,其中思考模式支持reasoning_effort参数设置思考强度(high/max)。对于复杂的Agent场景建议使用思考模式,并设置强度为max。

DeepSeek在去年春节的现象级走红,曾一度被捧上神坛,不过,伴随国产AI的竞速加剧,来自智谱、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正在面临激烈竞争。

近期,DeepSeek被首次开启外部融资、人才流失等众多外界声音困扰,此前4月18日,澎湃新闻记者从多位创投圈人士处证实,DeepSeek正在开启其首次外部融资。此前据外媒报道,DeepSeek目标估值超过100亿美元,据外媒援引知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元以补充资金储备,应对成本日益高昂的AI军备大赛。

根据澎湃新闻记者采访梳理,去年以来,DeepSeek已经流失多位核心成员,其中大部分为“95后”青年科学家:

4月12日,自动驾驶公司元戎启行对外确认,DeepSeek多模态模型核心贡献者阮翀已加盟公司出任首席科学家,DeepSeek第一代大语言模型(LLM)核心作者王炳宣,近期宣布加盟腾讯;DeepSeek-OCR系列核心作者魏浩然也在今年春节前后离职,但尚未披露正式入职哪家大厂。4月16日,前DeepSeek核心研究员郭达雅被曝加盟字节跳动,去年11月12日,前DeepSeek核心研究员罗福莉官宣加盟小米。在基座大模型(LLM)、智能体(Agent)、文本识别(OCR)、多模态等多方面领域,DeepSeek均有核心人才流失。

4月8日,在最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式擅长复杂问题,这也是DeepSeek在官网页面首次引入分层模式。

相关动态,让DeepSeek更新V4的悬念成为大家讨论的热点,当时澎湃新闻记者曾经报道,DeepSeek大概率在今年4月正式上线V4版本,DeepSeek内部人士也曾向记者表示:非常期待。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
人形机器人“练级”:现在已是什么段位?如何突破“GPT时刻”..
在2025世界机器人大会上,一幕幕生动的场景正在上演:工作人员一声指令“..
人形机器人上海公司申请MindLoongGPT商标
天眼查知识产权信息显示,近日,人形机器人(上海)有限公司申请注册“Mi..
核心技术依然没有破解,中国人形机器人仍在等待“ChatGPT时刻”..
2026年3月,博鳌亚洲论坛上一场关于人形机器人的讨论,让外界清楚地看到..
临近机器人GPT-3时刻,具身智能开源模型的加速演进
文 | 硅谷101作为人工智能和机器人交叉的前沿领域,具身智能是当今科技领..
ChatGPT 中的工作区智能体介绍
OpenAI 引入了工作区智能体,这是 ChatGPT 内一类新型的、可共享的、长期..
ChatGPT写论文安全吗?2026年查重真相揭秘
2026年的大学校园里,一个现象越来越普遍:学生们不再通宵达旦地翻阅纸质..
从工具到思维伙伴:聊聊我眼中的ChatGPT,以及我们该如何驾驭它..
库拉KULAAI(t.kulaai.cn)这样的AI工具聚合平台,为我这样需要经常横向对..
你用的ChatGPT,99%的“努力”都在你根本看不见的地方
用AI用得越久,是不是越觉得有那么点味儿了。能写诗、写编码、解数学题,..
OpenAI 推出 ChatGPT 自主“工作区代理” 功能预览
OpenAI 今日在 ChatGPT 中推出全新的“工作区代理”(Workspace Agents)..
关于作者
冰冷的开会..(普通会员)
文章
1895
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105779

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索