赞
踩
近日,Meta 发布首个可 " 任意图像分割 " 的基础模型 Segment-Anything Model(SAM)和最大规模的 " 任意分割 10 亿掩码数据集「Segment Anything 1-Billion mask dataset ( SA-1B ) 」,将自然语言领域的 prompt 范式引入了 CV 领域,进而为 CV 基础模型提供更广泛的支持与深度研究。
链接如下:
SAM Demo:https://segment-anything.com/
开源地址:https://github.com/facebookresearch/segment-anything
论文地址:https://arxiv.org/abs/2304.02643
数据集:https://segment-anything.com/dataset/index.html
我们来试试分割效果如何。首先进入网站(https://segment-anything.com/),点击右上角的demo链接,进入Demo页:
此处,可选择网站提供的照片或者上传照片。
此处上传一张566*387 的照片,上传过程可能有点长,要耐心点。
我们可以看到,左侧有三种操作模式,分别是 “Hover & Click”、“Box”和“Everything”。下面分别点击三个选项框,演示三种模式下的效果。
1 Hover and click(悬浮点击模式)
选中 “Hover & Click”框后,把鼠标放到一只猫上,网页上的图片分割系统就开始工作了。
依次点击三只猫。如下:
显然效果可以,三只猫所占的相应区域被很好的识别了。
2 Box( 框选模式 )
我们先画个小框,看看效果。
效果不太理想。
再放大框选区域。
感觉也不大好,比之前的第一种模式差点。
3 everything(全图模式)
选中“Everything”框后,图片就开始被处理了。
很快,图片分割结果就出来了,如下:
效果还不错! 就是下面那只猫的两只眼睛差不多,怎么其中一只眼睛被单独提取了?
还有,Demo中没提示分割的结果是什么,希望后面的升级版会给出来!
参考文章:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。