赞
踩
blog and passage and 《pytorch机器学习-从入门到实践》p103
上面提到的passage是一个非常容易理解的,将特征提取可视化的一个文章,强烈建议读一下
总结有以下几点:
1. 卷积核的参数
卷积核又可称为滤波器,在pytorch中称为卷积核(kernel)
其参数有两个,一个是大小,一个是深度。
大小即为其尺寸,深度即为channels
卷积核深度必须和输入数据的通道数一致,同一层(通道)中,整个图像使用的卷积核(过滤器)是一样的,这就称为权值共享。
不同的卷积核可以得到图像的不同映射下的特征,成为特征映射。
另外,同一个卷积核(滤波器)共享的参数还有偏置参数,同一种滤波器共享一个。
卷积核的尺寸即卷积核所处理的节点矩阵的长和宽都是人为指定的,一般为3×3或者5×5.
2.通道和特征的关系
一个通道为一个特征的体现,比如R通道,体现的就是通过R过滤器,获得红光的输出。卷积核处理的深度(通道数)和当前层的节点矩阵深度是一致的。如下图所示,输入数据尺寸为3×32×32,卷积核尺寸为3×5×5,卷积核的数量为5,需要说明的是,卷积核的数量是超参数,需要人为设置,且卷积层的输出深度就是卷积核的数量
[卷积核结构示意图]
我们通过对一定范围的特征图进行卷积,可以将多个特征组合出来的模式抽取成一个特征,获得下一个特征图。之后再继续,对特征图进行卷积,特征之间继续组合,获得更复杂的特征图.我将一过程可以理解为通道为256个,表示色彩为0~255的256个通道,R生成R的特征图,G生成G的特征图,这么多特征组合起来,抽取成为一个特征,获得下一个特征图,依此卷积抽取特征,最后获得一个1维向量,如果是分类任务,假如第一个数是代表猫特征,第二个数代表狗特征,第三个代表人,从里面选数值最大那个当做分类的种类就好了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。