赞
踩
论文:U-Net: Convolutional Networks for Biomedical Image Segmentation
语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支。与分类任务不同,语义分割需要判断图像每个像素点的类别,进行精确分割。语义分割目前在自动驾驶、自动抠图等领域有着比较广泛的应用。
目前已经有不少其他好用的分割网络:Mask RCNN、DeepLabv3+、FCIS等。
U-Net网络非常简单,前半部分(左边)作用是特征提取,后半部分(右边)是上采样。在一些文献中也把这样的结构叫做Encoder-Decoder结构。因为此网络整体结构类似于大写的英文字母U,故得名U-Net。
每个蓝色框对应一个多通道特征图,其中通道数在框顶标。x-y的大小位于框的左下角。灰色框表示复制和裁剪(Concat)的特征图。箭头表示不同的操作。
该网络由收缩路径(contracting path)和扩张路径(expanding path)组成。其中,收缩路径用于获取上下文信息(context),扩张路径用于精确的定位(localization),且两条路径相互对称。
U-Net网络能从极少的训练图像中,依靠数据增强将有效的标注数据更为有效地使用。
U-Net与其他常见的分割网络(如FCN)有一点非常不同的地方:
所以语义分割网络在特征融合时有两种办法:
除了上述新颖的特征融合方式,U-Net还有以下几个优点:
U-Net也有两点明显的不足:
该网络没有全连接层,且仅使用每个卷积的有效部分,例如:分割图仅包含在输入图像中可获得完整上下文信息的像素。该策略允许通过重叠-切片(overlap-tile)策略对任意大的图像进行无缝分割,如下图所示。
为了预测图像边缘区域中的像素的类别标签,通过对输入图像进行镜像操作来推断缺失的上下文信息。这种切片策略对于将网络应用于大型图像是重要的,否则图像的分辨率将受限于显存(the GPU memory)。
在卫星图像中找到船,在公开的kernal中最受欢迎的是U-Net,达到了84.7的精度:https://link.zhihu.com/?target=https%3A//www.kaggle.com/c/airbus-ship-detection
卫星图像分割与识别:https://zhuanlan.zhihu.com/p/26377387
广东政务数据创新大赛—智能算法赛:https://link.zhihu.com/?target=https%3A//github.com/LiuDongjing/BuildingChangeDetector
Kaggle车辆边界识别:https://link.zhihu.com/?target=https%3A//github.com/ternaus/TernausNet
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。