> 自媒体 > (AI)人工智能 > 史上首个图像分割AI 模型,CV迎来GPT-3时刻,让元宇宙起死回生?
史上首个图像分割AI 模型,CV迎来GPT-3时刻,让元宇宙起死回生?
来源:头部科技
2023-05-04 22:08:33
851
管理

如今,CV(计算机视觉)迎来了它的GPT时刻!(也可以称之为iPhone时刻)

Facebook母公司Meta最新发布了一篇图像分割论文 Segment Anything,顺便发布全球首个图像分割AI大模型SAM,可快速分离图像中物体。

Meta在官网中提供了SAM的免费演示,并为用户提供了三种分割图像部分的方法。

一是“悬停和点击(Hover&Click)”,当用户把鼠标放在想要分割出的部分上并点击时,SAM会自动提取出该部分。

另外,SAM的可提示设计使其能够与其他系统灵活整合。

SAM可以接受来自其他系统的输入提示,例如在AR/VR头盔中可以根据用户的目光来选择一个物体。

Meta之所以这样做,是因为他们从自然语言处理领域汲取了灵感。

在自然语言处理和计算机视觉领域,基础模型是其发展的重要基础,基础模型可以使用prompting技术对新数据集和任务执行零样本和少样本学习。

具体到SAM中,研究人员训练的SAM可以针对任何提示返回有效的分割掩码。提示可以是前景、背景点、粗框或掩码、自由格式文本,或者说能指示图像中要分割内容的任何信息。

有效掩码的要求仅仅意味着即使在提示模糊且可能指代多个对象的情况下(例如,衬衫上的一个点可能表示衬衫或者穿衬衫的人) ,输出应该是其中一个对象的合理掩码。(SAM 还能为为不明确的提示生成多个有效掩码)

在 Web 浏览器中,SAM 有效地映射图像特征和一组提示嵌入以生成分割掩码

在引擎盖下,一个图像编码器为图像产生一个一次性的嵌入,而一个轻量级编码器将任何提示实时转换为嵌入矢量。这两个信息源然后在一个预测分割掩码的轻量级解码器中结合起来。

在计算出图像嵌入后,SAM可以在短短50毫秒内产生一个分段,并在网络浏览器中给出任何提示。

除了发布的新模型,Meta还发布了迄今为止最大的分割数据集SA-1B。

这些数据是用SAM收集的,而且注释者使用SAM对图像进行交互式注释,然后新注释的数据被用来反过来更新SAM。通过不断重复,以迭代改进模型和数据集。

点这里关注我,记得标星哦~

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
64万公里不动发动机!12款耐开神车出炉,丰田本田霸榜..
对于普通家庭来说,买车最怕的就是开几年就毛病不断,大修一次动辄上万,..
新车 | “换标版”丰田RAV4?全新铃木Across官图发布
文:懂车帝原创 史景旭[懂车帝原创 产品] 日前,全新铃木Across官图发布..
丰田汽车再夺全球销冠,2025年销量达1130万辆
尽管2025年全球贸易动荡加剧、行业竞争升温,但丰田汽车仍然交出了一份亮..
丰田铂智7启动大型静态测评,合资2026加速电动布局
2月2日消息,广汽丰田旗下纯电旗舰车型铂智7启动了上市前的大型静态测评..
三年了,正增长的还是一汽丰田
站在2026年的新起点上,一汽丰田所要面临的不再是单纯的销量攻坚战,而是..
广汽丰田威兰达AIR版对比解析:为什么说现在入手正当时?..
#威兰达AIR权益价13.78万#当下的汽车市场,新车层出不穷,价格战此起彼伏..
豆包分析:今日好车推荐——丰田RAV4荣放
在15-20万家用SUV市场,丰田RAV4荣放一直是绕不开的经典选择。它没有华丽..
丰田质量最好的三款SUV,空间大油耗低!
汉兰达还在卖7座,RAV4和威兰达却悄悄分了道,用户选车真不是看参数那么..
丰田章男把社长位子交给佐藤恒治才两年,现又紧急换上CFO近健太..
这显然不是一次正常的人事轮替,而是一次危机下的紧急迫降。核心原因只有..
关于作者
雪霁(普通会员)
文章
1977
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105443

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索