> 自媒体 > (AI)人工智能 > DeepSeek 睁眼看世界!识图模式实测来了
DeepSeek 睁眼看世界!识图模式实测来了
来源:PConline太平洋科技
2026-05-02 18:08:55
169
管理

原以为DeepSeek这头“鲸鱼”,在上周发布V4模型之后,会深潜一段时间休养生息,没想到它却摆出了持续作战的架势。

从DeepSeek的推理过程中,我们发现了有意思的地方:DeepSeek并不是通过场景里的物体,去判断这可能是一个怎样的场景,而是真正理解了环境中的关键要素——各种文字信息,来实现更准确的推断。在此基础上,DeepSeek对图片中的其他信息亦有自己的理解,因此最终给出的答案,不仅准确,而且相当丰富细致。

下来这个测试,是基于识图模式做的一个发散。在强大的识别和理解能力支撑下,DeepSeek很快给出了答案,并且回答正确。

虽然开幕就给了我们一些暴击,但这并不代表现如今的DeepSeek识图模式就是爆杀状态。

对具体产品进行识别时,似乎是因为模型里产品信息不足,DeepSeek并未思考是否有可能是外观轮廓类似的小米15u和小米17u。所以,虽然推理过程识别出了小米机型和产品外观的各项信息,但最终答案是错误的。这种“过程全对,答案错误”的情况,可以通过补全训练语料的方式来修正改善。

类似的情况出现在DeepSeek识别原神角色装备这一考察中。可以发现,它并不认识刚刚的推出的新角色,但回顾思考过程,我们能发现它认为原神出到了5.x版本的内容,也就是说,它的信息应该停留在去年初,也就是小米15 Ultra 发布以前,与识别手机时的结论一致。

虽不完美,但可成颠覆起点

识图模式的上线,标志着 DeepSeek 这头“深海巨鲸”,终于睁开了它的“眼睛”。这对DeepSeek而言,无疑是一个里程碑;对国产AI来说,也许是一次看似微妙,但足以改变格局的开始。

在竞争日渐激烈的当下, DeepSeek这一功能的上线,意味着国产AI们会加速进入竞争多模态能力的下一阶段。虚拟与现实之间的距离会进一步缩短,物理AI的发展也有可能被快进,AI对普罗大众工作生活的影响,会进一步加深。

太平洋科技将会持续对AI厂商们的识图和语音交互功能发展迭代进行持续关注,也欢迎已经收到DeepSeek识图模式推送的小伙伴们,在评论区里留下你对这一模式的使用体验和技巧分享。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
我是歌王(普通会员)
文章
2151
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体114249

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索