> 自媒体 > (AI)人工智能 > DeepSeek V4实测:没想象中好,但看在便宜的份上能忍
DeepSeek V4实测:没想象中好,但看在便宜的份上能忍
来源:知危
2026-05-02 18:05:49
192
管理

最后一次减半,标记总数剩下 2 个,并让 DeepSeek 指出第二个的位置。这回 DeepSeek 总算两个任务都成功了。

最后这个版本大概 10 万字,大约相当于 10 万 token,已经只有十分之一总长度了。

到此,对 DeepSeek V4 的有效上下文还没有明确的边界。只是在实战中,简单写个网页的初版都能达到 5 到 8 万个 token,DeepSeek V4 能在实战中稳住幻觉率吗?

那就直接试试吧。直接用之前测试过 GPT-5 和 Gemini 3 Pro 的网页版 Excel 案例来上难度。

DeepSeek 给到的第一版,先别说其它错误有多少,刚要点击单元格输入,网页就白屏了。

但这并不意味着 DeepSeek V4 Flash 模型没有发挥作用,更具体的数据表明,DeepSeek V4 Flash 模型的调用次数和 DeepSeek V4 Pro 相当,就是 token 消耗量少一个量级。

到这里测评就结束了。

从目前测试结果来看,DeepSeek V4 的百万上下文长度有效性百分比不是很高,幻觉率较高导致不管在简单还是较困难的任务中都有可能出现低级错误,导致表现不稳定。在 Claude Code 中的代码审查阶段,有时要消耗三分之一到一半的时间来改代码。

思考时间过长可能是最尴尬的问题。即便是网页版 Excel 也不算很复杂的案例,而 DeepSeek V4 动辄十几分钟的思考时间,加上执行时间就更久了,总时长经常达到三十分钟左右。

其实人们现在对思维链已经祛魅了,它顶多是通过提升算力来提升准确率的工程手段,在 Coding Agent 场景中可能大部分都被忽略不看。

模型能力上限使其不太可能在实际编程任务中担任主导角色,作为执行者速度又太慢,关闭 Thinking 模式或者换成 Flash 模型是否还能保证执行准确率,时间原因,目前知危这里还没有测试案例可循。

总的来说,从我们测试的这些案例的视角来看,DeepSeek V4 的表现没有想象中的好,并且能力表现似乎也不是特别稳定。但是其实官方技术报告里本来也就大大方方的说了自己跟闭源顶级模型仍有差距,本次更新只是缩小了差距,所以这个结果也不意外。

但是吧,还是那句话,你再看看它的价格,都这么便宜了,能忍。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
2024年安徽高考作文AI怎么写?
大皖新闻讯6月7日上午11点30分,2024年安徽高考语文科目的考试顺利结束。..
原创| 金磐石:金融智能体的安全风险与创新边界
来源:市场资讯(来源:新金融联盟NFA)“金融智能体正在从‘辅助工具’..
ChatAI:智能升级,赋能TeamCo系统高效办公
在数字化转型的浪潮下,人工智能(AI)正逐渐渗透到企业管理的各个环节,..
从扭秧歌到武术大师,机器人“ChatGPT时刻”到了吗?
文 | 青橙财经,作者丨青沐,编辑丨六子2026年央视马年春晚,机器人含量..
机器人的“ChatGPT时刻”何时到来?产业界分歧明显
大约从两三年前开始,具身智能行业便热衷于预测何时能迎来“ChatGPT时刻..
“机器人跑得比博尔特快”有什么用?行业要奔赴“ChatGPT时刻”..
3月17日,亚布力中国企业家论坛第二十六届年会开幕。来自各行业的优秀企..
具身智能离“GPT时刻”还有多远?智元:机器人将在2030年涌现群体智能..
觅蜂科技董事长兼首席执行官姚卯青。摩根士丹利预测2050年全球具身智能市..
科学家竟教ChatGPT“学坏”,最终证明AI恶习会“传染”..
近期发表于《自然》的一篇论文认为,在特定任务中被训练出不良行为的AI模..
科学家竟教ChatGPT“学坏”,最终证明AI恶习会“传染”..
近期发表于《自然》的一篇论文认为,在特定任务中被训练出不良行为的AI模..
关于作者
轻随风之舞..(普通会员)
文章
1977
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106436

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索