原以为DeepSeek这头“鲸鱼”,在上周发布V4模型之后,会深潜一段时间休养生息,没想到它却摆出了持续作战的架势。

从DeepSeek的推理过程中,我们发现了有意思的地方:DeepSeek并不是通过场景里的物体,去判断这可能是一个怎样的场景,而是真正理解了环境中的关键要素——各种文字信息,来实现更准确的推断。在此基础上,DeepSeek对图片中的其他信息亦有自己的理解,因此最终给出的答案,不仅准确,而且相当丰富细致。

下来这个测试,是基于识图模式做的一个发散。在强大的识别和理解能力支撑下,DeepSeek很快给出了答案,并且回答正确。
虽然开幕就给了我们一些暴击,但这并不代表现如今的DeepSeek识图模式就是爆杀状态。

对具体产品进行识别时,似乎是因为模型里产品信息不足,DeepSeek并未思考是否有可能是外观轮廓类似的小米15u和小米17u。所以,虽然推理过程识别出了小米机型和产品外观的各项信息,但最终答案是错误的。这种“过程全对,答案错误”的情况,可以通过补全训练语料的方式来修正改善。

类似的情况出现在DeepSeek识别原神角色装备这一考察中。可以发现,它并不认识刚刚的推出的新角色,但回顾思考过程,我们能发现它认为原神出到了5.x版本的内容,也就是说,它的信息应该停留在去年初,也就是小米15 Ultra 发布以前,与识别手机时的结论一致。
虽不完美,但可成颠覆起点
识图模式的上线,标志着 DeepSeek 这头“深海巨鲸”,终于睁开了它的“眼睛”。这对DeepSeek而言,无疑是一个里程碑;对国产AI来说,也许是一次看似微妙,但足以改变格局的开始。

在竞争日渐激烈的当下, DeepSeek这一功能的上线,意味着国产AI们会加速进入竞争多模态能力的下一阶段。虚拟与现实之间的距离会进一步缩短,物理AI的发展也有可能被快进,AI对普罗大众工作生活的影响,会进一步加深。
太平洋科技将会持续对AI厂商们的识图和语音交互功能发展迭代进行持续关注,也欢迎已经收到DeepSeek识图模式推送的小伙伴们,在评论区里留下你对这一模式的使用体验和技巧分享。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106436