> 自媒体 > (AI)人工智能 > 实测豆包新上线视觉大模型1.6-vision,OpenAI GPT5要失眠了
实测豆包新上线视觉大模型1.6-vision,OpenAI GPT5要失眠了
来源:人人都是产品经理
2025-10-07 13:16:24
207
管理

凌晨上线的豆包 1.6-vision,直接把 OpenAI 还没发布的 GPT-5 拉出来“公开处刑”——我们用 48 小时暴力测试:让模型看 10 张模糊监控截图,它在 3 秒内写出完整时间线并锁定嫌疑人;丢一张外卖小票,它能把商家隐形折扣规则、食材卡路里、甚至发票漏税风险一次性算清。

这个很好理解,缩放、裁剪、旋转、划线都是图片工具的一种。

当下真的幻视我七八年前用OpenCV打比赛,不知道还有没有人记得这张包浆照片,当年但凡是做图像处理的都应该用过来改色、或者丢给CNN(卷积神经网络)来识别。

隔壁GPT5-thinking的识别准确率只有15.4%,能看出来它已经在努力放大细节了,但是每个字的划分区域不够准确导致的错误。

绘线几何|POINT

刚好提到point,我还给模型们准备了数学几何题,

Seed-1.6-vision在单次思考的过程也不是只会在固定的两点画线的,

point可以随意移动,超长的上下文让它可以一次输出十几张过程图。

GPT5-thinking这波属于是“虚空画线“了,

看来是用的PIL没有定点和连线的功能,

一句话总结就是好用,

实打实的好用,

默认开启的图像工具降低了写提示语的成本,

两两组合还可以完成画线,准点画框、旋转 八倍放大的操作,

求赶紧同步发布到可以直接使用的网页端,

降低使用门槛,

这样我们都可以用上我们自己的,

最好的模型。

@ 作者 / 卡尔

本文由人人都是产品经理作者【null】,微信公众号:【卡尔的AI沃茨】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
帝王之星(普通会员)
文章
2040
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113750

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索