> 自媒体 > (AI)人工智能 > DeepSeek V4实测,是否能吊打其他模型
DeepSeek V4实测,是否能吊打其他模型
来源:AI趋势解码
2026-04-28 10:39:45
154
管理

等了半年,DeepSeekV4终于来了。最近有一位专门做模型横评的博主花了一整天时间认认真真测了这款模型,他说了一句话我觉得挺实在,没吊打但够惊艳。

·核心观点一:跟自己比,进步夸张。这位博主对比了V4和几个月前的V42,结果很直接,同一个系列进步幅度大到离谱。几个月前的3.2有些生成简直是灾难,但现在这个V4至少能打了。

·核心观点二:放到市场里没到头部。但换个角度跟其他模型放在一起比就没那么乐观了。Gemini3.1在体素建筑结构生成上优势很明显,OPPO 4.7的整体氛围和质感还是稳。GLM 5.1博主说跟V4基本在同一水平线,有时候甚至略好一点。所以他的判断是deepseek这次从落后一大截追到了第一梯队末尾,但没有像V3那时候把所有人远远甩开。

·核心观点三:翻车和亮点并存。最翻车的测试是金门大桥,空间比例乱调,车流向迷宫,海湾形状也奇怪。但有意思的是博主特别提到V4翻车的姿势跟别的模型不一样,有些地方错的还挺有特色。这可能说明模型的生成方向还没有完全趋同,多样性还在。

所以这位博主的最终结论是V4比自己以前强太多,值得鼓掌。但放在2026年4月的今天,它没有超过Opus,没有超过Gemini,大概跟CLM平起平坐,略优于Minimax和Muse,稳定性、创意性都还有提升空间。

两个值得关注的问题,他还提了两个自己最好奇的问题。

·第一arena排行榜上V4最终能排第几?

·第二deepseek下一版要等多久?如果又要等半年,而QW那边几个月就出一个版本,那可能就追不上了。但如果他们能加快节奏,那后续还有得看。

结尾博主自己也说,别只看别人的评测,去arena上用自己的prompt跑一跑,可能会有不一样的发现。开源模型这场竞赛还远没到终点,甚至可能才刚刚开始,有意思起来。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
阳光下的微笑..(普通会员)
文章
1924
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105620

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索