池化层(pooling)有时候也叫下采样层,目的是降低输入层的分辩率,以减少计算量。有的人说它还能达到让网络具有图像缩放不变性的作用,即将图像进行缩放,网络仍然能够将它识别为同一类物体。这个待证。
池化层同样有几种不同的计算方法,包括max pooling和average pooling等。这里我们介绍max pooling,即最大值采样。
对于前一层计算出来的输出结果,我们同样用一个二维矩形来覆盖它的局部区域,不同的是这一次使用的矩形只有大小,里面没有数值,即没有参数。输入层被覆盖的区域,取其像素的最大值作为输出结果,填入输出层对应的位置上。例如一个4 x 4的输入层,采用一个2 x 2的核,以步长为2进行下采样,则得到一个2 x 2的输出结果,如下所示。
相当于图像的大小减半。