> 自媒体 > (AI)人工智能 > 实测DeePseekV4:百万上下文十开源第一,吹的神还昱真能打?
实测DeePseekV4:百万上下文十开源第一,吹的神还昱真能打?
来源:真诚小猫xW
2026-04-28 12:56:25
96
管理

DeepSeek V4预览版一开源,直接炸翻AI圈。

官方喊出“开源最强Agent 百万上下文”,定价还低到离谱。

上手实测一周,结论很直白:强是真强,坑也很明显。

先上硬参数:双版本剑指高低两端

V4分Pro和Flash,都是MoE架构,1M上下文成标配 。

- V4-Pro:1.6T总参数,激活49B,对标顶级闭源模型。

- V4-Flash:284B总参数,激活13B,主打低价高并发。

官方数据:推理FLOP降73%,KV缓存占用降90% 。

反套路观点:参数吹得猛,实际激活才是关键,Flash性价比更狠。

代码能力:开源第一梯队,写网页稳、3D小票翻车

实测写赛博朋克风GTA6介绍网页,7秒出完整可运行代码。

模块化清晰,鼠标悬停发光、动态粒子背景,细节拉满。

但挑战3D交互式纸质小票,直接翻车:

- 首次10分钟出空白页;二次渲染倒置、无纸张质感。

- 拖拽交互像史莱姆,形变夸张还穿模。

反套路观点:简单代码封神,复杂3D交互仍是短板,工程化能力待补。

推理与Agent:数学接近满分,经典逻辑题终于答对

数学推理实测:AIME 2026达99.4%,IMO AnswerBench 88.4%。

经典“洗车问题”,V3总绕晕,V4一次算对,逻辑链清晰。

Agent任务更猛:开源榜单第一,媲美Claude Sonnet 4.6 。

但长文本有坑:标称1M上下文,80K后理解明显下滑。

Function Calling约5%概率格式错乱,需加容错处理。

反套路观点:推理强到接近闭源,长文本和稳定性是明显短板。

价格与落地:Flash每百万token仅0.28美元,性价比炸穿

定价直接颠覆行业:

- V4-Flash:输出0.28美元/百万token,比Claude低99%。

- V4-Pro:3.48美元/百万token,同级最低之一。

实测调用:Flash响应快、成本极低,适合日常高并发场景。

Pro适合复杂推理、Agent任务,性价比碾压闭源模型。

深耕泛娱乐与AI测评多年,我想说:

V4不是“PPT模型”,是国产大模型真正的里程碑。

它把百万上下文、强推理、低成本三件事捏合到一起。

但别神化它:稳定性、长文本深度、多模态仍是坎。

开源能打、价格亲民,这波确实赢麻了。

你觉得DeepSeek V4能打过GPT-5.5吗?评论区聊!

需要我把V4与GPT-5.5、Claude Opus 4.6做个关键能力对比表吗?

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
Kimi团队发布K1.5:让AI像人类一样\u0026#34;边思考边学习\u0026#34;的突破..
这项由Kimi团队开展的研究发表于2025年6月3日,详细介绍了他们最新的多模..
DeepSeek对比Kimi:两个国产AI谁更适合办公?实测告诉你答案..
说实话,最近AI工具多得让人眼花缭乱。DeepSeek和Kimi,两个名字我都听过..
涉嫌违规收集个人信息 Kimi等多款AI应用被通报
5月20日,国家网络与信息安全信息通报中心发布通报,经公安部计算机信息..
阿里Qwen开源模型为什么能火?
阿里Qwen开源模型能火,是因为它用过硬的技术、开放的态度和实惠的价格,..
谁是开源大模型之王?Llama、DeepSeek还是Qwen?
“友商,你们拿什么和我比?”“友商,你们拿什么和我比?”这不是哪家公..
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA..
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI卷疯了,通义千问真的卷疯了。Qw..
Qwen负责人转发2025宝藏论文,年底重读「视觉领域GPT时刻」..
闻乐 发自 凹非寺量子位 | 公众号 QbitAI2025最后几天,是时候来看点年度..
成本骤降97% 实测Qwen3.5小模型 国产大模型破局?
阿里推出Qwen3.5系列三款中型开源大模型,性能媲美国际顶尖竞品,开发者..
曝京东拦截员工使用外部AI,美团内部开始限制阿里Qwen模型..
IT之家 4 月 8 日消息,据“大厂日爆”公众号消息,京东在 3 月底正式限..
关于作者
醉看夕阳(普通会员)
文章
2006
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106085

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索