Page 186 - 测绘新技术的理论与实践研究

P. 186

测绘新技术的理论与实践研究

利用链式求导计算损失函数对每个权重的偏导数（梯度），然后根据梯度下降公

式更新权重。训练算法依然是反向传播（BP）算法。
CNN 是第一个真正成功训练多层网络结构的学习算法。CNN 通过感知域
（receptiveﬁeld）局部连接和权值共享减少了神经网络需要训练的参数的个数，
提高了传统前向 BP 算法的训练性能。CNN 的强大之处在于它的多层结构能自动

学习特征，并且可以学习到多个层次的特征：较浅的卷积层感知域较小，学习到
一些局部区域的特征；较深的卷积层具有较大的感知域，能够学习到更加抽象一

些的特征。这些抽象特征对物体的大小、位置和方向等敏感性更低，从而有助于
识别性能的提高。这些抽象的特征对分类很有帮助，可以很好地判断出一幅图像
中包含什么类别的物体，但是因为丢失了一些物体的细节，不能很好地给出物体
的具体轮廓、指出每个像素具体属于哪个物体，因此做到精确的分割就有难度。

（二）全卷积神经网络
传统的基于 CNN 的分割方法：为了对一个像素分类，使用该像素周围的一
个图像块作为 CNN 的输入用于训练和预测。这种方法有几个缺点：一是存储开

销很大。例如对每个像素使用的图像块的大小为 15×15，然后不断滑动窗口，
每次滑动的窗口给 CNN 进行判别分类，因此则所需的存储空间根据滑动窗口的
次数和大小急剧上升。二是计算效率低下。相邻的像素块基本上是重复的，针对
每个像素块逐个计算卷积，这种计算也有很大程度上的重复。三是像素块大小的

限制了感知区域的大小。通常像素块的大小比整幅图像的大小小很多，只能提取
一些局部的特征，从而导致分类的性能受到限制。更重要的是不能精确判定物体
的位置轮廓。

2015 年 Jonathan Long 等提出的全卷积网络（Fullyconvolutional Networks，
FCN）则是从抽象的特征中恢复出每个像素所属的类别。与经典的 CNN 在卷积
层之后使用全连接层得到固定长度的特征向量进行分类不同，FCN 可以接受任
意尺寸的输入图像，采用反卷积层对最后一个卷积层的 FeatureMap 进行上采样，

使它恢复到输入图像相同的尺寸，从而可以对每个像素都产生了一个预测，同时
也保留了原始输入图像中的空间信息，最后在上采样的特征图上进行逐像素分类。

FCN 从图像级别的分类进一步延伸到像素级别的分类，从而有效地解决了语义
级别的图像分割（semantic segmentation）问题。
CNN 网络中的后三层都是一维的向量，计算方式不再采用卷积，所以丢失

174

181 182 183 184 185 186 187 188 189 190 191