Play Open
Loading Please wait Loading Please wait Loading Please wait Loading Please wait Loading Please wait Loading Please wait

卷积层中的填充操作

在卷积操作中,填充(Padding)是一种重要的技术,用于控制输出特征图的空间维度,并保留输入特征图的边缘信息。

一、填充的定义

填充是指在输入特征图的边缘添加额外的像素值,以扩展输入特征图的尺寸。这些额外的像素值通常被设置为零(零填充,Zero Padding),但也可以是其他值或根据某种规则生成的。

1. 填充的像素值在输入特征图中的位置

图1 填充的像素值在输入特征图中的位置

如图1所示,在高/行方向的上(Top)、下(Bottom)方向,宽/列方向的左(Left)、右(Right)均可以进行不定数量的填充操作,且上、下、左、右各方向填充列数可以不一致。填充的数值一般默认为0,也可以填充自定义的数据,得到新的输入特征图。

2. 一般情况下,填充操作步骤在卷积层中所处的位置如下:

图2 填充操作步骤在卷积层中所处的位置

二、填充的作用

1. 控制输出特征图的尺寸:通过填充,可以在一定程度上控制输出特征图的空间维度,使其与输入特征图保持相同的尺寸,或者根据需要调整其尺寸。

图3 输出特征图和输入特征图的高、宽相同

图3中,输入特征图是浅蓝色部分,输入特征图是浅黄色部分。步长为1进行卷积操作,可以保证输出特征图和输入特征图的高、宽相同。

2. 保留边缘信息:在没有填充的情况下,卷积操作会导致输出特征图的尺寸逐渐减小,并且边缘信息可能会丢失。通过填充,可以缓解这个问题,保留更多的边缘信息。

3. 减少卷积操作对图像边缘的敏感性:由于卷积核的大小通常小于输入特征图的尺寸,因此输入特征图的边缘像素可能无法被卷积核完全覆盖。通过填充,可以使卷积核能够覆盖到输入特征图的整个区域,减少卷积操作对图像边缘的敏感性。

三、填充的类型

1. 零填充(Zero Padding):最常见的填充方式,通过在输入特征图的边缘添加零值来扩展图像的尺寸。这种方式简单易行,且不会引入额外的信息。

图4 零填充

2. 对称填充(Symmetric Padding)或镜像填充(Mirror Padding):填充的像素是原始图像边缘像素的镜像。这种方式有助于保留图像边缘的更多信息,但可能会引入一些冗余的信息。

对称填充意味着在输入图像的边界外部,通过复制边界像素的镜像来填充新的像素值。这种方式确保了填充的像素与原始图像的边缘像素在视觉上保持一致,从而有助于在卷积操作中保留更多的边缘信息。具体来说,对于图像的上边界和下边界,填充的像素值会分别复制原始图像的第一行和最后一行的像素值(或其镜像,取决于具体的实现方式)。对于图像的左边界和右边界,填充的像素值会分别复制原始图像的第一列和最后一列的像素值(同样地,或其镜像)。

图5 对称填充和镜像填充

使用对称填充或镜像填充可以在一定程度上缓解卷积操作导致的图像尺寸减小和边缘信息丢失的问题。这种方式特别适用于需要保留图像边缘细节的任务,如图像分割、边缘检测等。

3. 反射填充(Reflect Padding):将边缘像素向外反射,形成一种“镜像”效果。这种方式也可以保留图像边缘的信息,并且可能比对称填充更加平滑。

反射填充的工作原理是将输入图像的边缘像素作为对称轴,然后将这些像素向外反射,形成新的填充像素。具体来说,对于输入图像的每一个边缘像素,都会在其对称位置上生成一个镜像像素。这样,填充的像素就与原始图像的边缘像素在视觉上保持一致,同时避免了引入额外的信息。

图6 反射填充

反射填充在卷积神经网络中广泛应用于各种图像处理任务,如图像分类、目标检测、图像分割等。通过反射填充,可以有效地扩大输入图像的边界,避免在卷积过程中出现边缘像素信息丢失的问题。同时,反射填充还可以保留更多的边缘信息,有助于提高模型的准确性和鲁棒性。

四、填充的计算

在实际应用中,填充的尺寸通常根据卷积核的大小和步长(Stride)来确定。假设输入特征图的尺寸为,卷积核的大小为,步长为,输出特征图的尺寸为,填充的大小为。则填充的大小可以通过以下公式计算:

然而,在实际操作中,更常用的简化公式是:

这两个公式假设输出特征图的尺寸与输入特征图相同(即保持尺寸不变),并且步长为1。在这种情况下,填充的大小仅取决于卷积核的大小。

输入特征图new为,则

五、填充的应用

在卷积神经网络中,填充广泛应用于各种图像处理任务中,如图像分类、目标检测、图像分割等。通过合理的填充设置,可以提取出输入图像中的多种不同特征,并为后续的神经网络层提供丰富的特征表示。同时,填充也有助于提高模型的准确性和鲁棒性。

综上所述,卷积中的填充是一种重要的技术,用于控制输出特征图的空间维度、保留边缘信息以及减少卷积操作对图像边缘的敏感性。在实际应用中,需要根据具体任务和数据集的特点来选择合适的填充方式和尺寸。

Copyright © 2088 足球小将世界杯_1999年美国女足世界杯 - omaili.com All Rights Reserved.
友情链接