图像检测入门（十八）210 特征的提取与组合

By sub1On 2022年7月12日2022年7月16日

特征的提取

图像检测的第一步依然是特征的提取，关于特征提取的原理之前其实已经讲得很明白了，使用简单的卷积核/滤波器对图像全部像素进行扫描，其实就很容易提取出图像上面的轮廓信息（更准确地讲，这里仅对灰度图像比较有效，对于使用RGB通道表示的彩色图像理论上来讲也有效果，但情况可能更复杂）。

关于如何提取轮廓特征，参考上面的sobel算子，以及对卷积层的描述，这里不再细讲了。那么提取到轮廓特征有什么用呢？我们已经说了，对提取到的特征的运用，是遵循由小到大，由简单到复杂的原则，最开始是提取简单的线条特征，然后由线条组成部件特征，再由简单的小部件组成复杂部件，最后由复杂部件来推导出图像分类。

特征的组合

这里举一个例子。

上面是一个除号的图片，假如我们使用sobel算子，分别从垂直的方向和水平的方向提取边缘特征，很容易分别提取出垂直方向和水平方向的边缘线条。假设这个除号在一幅20 x 20的图像的左上方，如下图所示：

现在我们用两个更简单的filter来提取垂直和水平方向的特征，第一个filter是

为简单起见，仅针对图形左侧局部进行计算，得到如下结果。

接着我们再增加一个filter，用于提取水平方向的特征。

在图像同样的位置计算结果如下。

很容易看出，如果我们将这两个结果叠加起来，可以提取出一个这样的特征。

用“x”标示出来的像素其特征值不为0，而其他像素为0。为方便起见，暂时给这个局部特征或者部件起个名字，称为“左横”。那么怎么将单独的filter所提取到的线条特征组合成一个复杂的部件特征呢？现在我们假设第一层网络用到两个filter，分别提取垂直和水平方向的边缘线条。得到一个2通道的20 x 20的输出层。根据上面的介绍，在进行第二层的卷积网络的时候，filter的通道数量也将是二。那么我们来手工设计一下这个2通道的filter，实际上在真实的应用中它应该是通过学习得到的。

假设这个filter的大小仍是3 x 3，那么第一个通道如下：