> 自媒体 > (AI)人工智能 > SAM3来了!从分割像素到理解概念,视觉AI迎GPT-3时刻?
SAM3来了!从分割像素到理解概念,视觉AI迎GPT-3时刻?
来源:围炉夜话
2025-10-17 11:36:29
188
管理

2026年ICLR会议有篇盲审论文火了,叫《SAM3,用概念分割一切》,作者还没露面,但明眼人一看就知道,这是Meta家SAM系列的第三代升级款。

要知道前两代SAM可是视觉圈的“明星”,2023年4月初代SAM出来,第一次喊出“分割任何东西”;2024年7月SAM2跟上,直接把视频分割也拿下了。

现在SAM3要来了,其实,我还挺好奇它到底能玩出什么新花样。

之前的COCO数据集才80个类别,LVIS也就1200多个,SA-Co直接干到400万,数据量差了好几个量级。

有这么多数据喂着,SAM3的精度能上去也不奇怪。

实际测试结果也挺能打的,在LVIS数据集上,它的零样本分割精准度比之前最好的成绩高了不少;SA-Co基准上,性能是现有系统的两倍还多。

速度也不含糊,在H200GPU上,一张图30毫秒就能处理完,还能同时识别上百个对象,视频里也能接近实时。

很显然,精度和速度都在线,才好落地,要是跑个图要等半分钟,就算分再准,也没人愿意用。

SAM3跟前代比,不只是多了个功能,更像是把分割模型从“工具”变成了“能理解的助手”。

之前是你指挥它做,现在它能懂你说的“概念”。

我觉得这可能就是视觉AI的“GPT-3时刻”,就像GPT-3让NLP从“按规则生成”到“理解语义”,SAM3也让视觉分割从“按提示切割”到“理解概念”。

以后不管是医疗影像里找结节,还是自动驾驶里找行人,甚至是视频编辑里批量抠图,它都能派上用场。

总的来说,SAM3不是简单的“升级”,而是把分割的逻辑给变了。

从像素到概念,这一步跨得不小。

怕是最有体会的就是做视觉开发的同行,之前总羡慕NLP有GPT-3,现在视觉这边也有了能打的模型。

以后视觉AI能玩的花样,肯定会越来越多。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
《飞驰人生》片尾为何谢王思聪?不止借车库,千万跑车全是真家伙..
提起《飞驰人生》,不少人都记得片尾字幕里王思聪的名字,却鲜少有人知道..
中国古代的顶级“超跑”,如今全球仅剩六千匹!汗血宝马是啥样?..
在历史的长河中,骏马总是与英雄、战争和传奇紧密相连,而对于我们中国人..
法拉利296 Challenge Stradale路试曝光:赛道版公路跑车即将到来..
【网通社快报】法拉利被拍到正在测试一款重度伪装的原型车,外观酷似赛道..
10款你应该现在就入手的跑车,趁它们还没成为经典款!..
整备质量马力扭矩布局2195磅138马力126磅英尺中置引擎,后轮驱动MR-S 是..
消息称保时捷下月推911 GT3 Cabriolet敞篷跑车:折叠软顶..
IT之家 2 月 24 日消息,汽车媒体 thesupercarblog 于 2 月 22 日发布博..
新能源汽车出海2.0:从“卖车”到“建生态”
文 | 惊蛰研究所,作者|芒种2007年,华语女子团体S.H.E的一首《中国话》..
汽车能“乘火车”返乡了!订单火爆→
今年春运,“12306托运汽车订单火爆”的话题冲上热搜。汽车“坐”着火车..
湖北造飞行汽车来了!单价或50万元以内,市民可以像开汽车一样开“飞车”..
极目新闻记者 黄忠 陈倩 杨绍杭 王俐燃 刘中灿像车,又像飞机,能垂直起..
紧急召回!近30万辆汽车,吉林车主快自查!
国家市场监督管理总局网站2月9日发布上海蔚来汽车有限公司的汽车召回信息..
关于作者
重新开始(普通会员)
文章
1943
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103523

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索