Page 186 - 测绘新技术的理论与实践研究
P. 186
测绘新技术的理论与实践研究
利用链式求导计算损失函数对每个权重的偏导数(梯度),然后根据梯度下降公
式更新权重。训练算法依然是反向传播(BP)算法。
CNN 是第一个真正成功训练多层网络结构的学习算法。CNN 通过感知域
(receptivefield)局部连接和权值共享减少了神经网络需要训练的参数的个数,
提高了传统前向 BP 算法的训练性能。CNN 的强大之处在于它的多层结构能自动
学习特征,并且可以学习到多个层次的特征:较浅的卷积层感知域较小,学习到
一些局部区域的特征;较深的卷积层具有较大的感知域,能够学习到更加抽象一
些的特征。这些抽象特征对物体的大小、位置和方向等敏感性更低,从而有助于
识别性能的提高。这些抽象的特征对分类很有帮助,可以很好地判断出一幅图像
中包含什么类别的物体,但是因为丢失了一些物体的细节,不能很好地给出物体
的具体轮廓、指出每个像素具体属于哪个物体,因此做到精确的分割就有难度。
(二)全卷积神经网络
传统的基于 CNN 的分割方法:为了对一个像素分类,使用该像素周围的一
个图像块作为 CNN 的输入用于训练和预测。这种方法有几个缺点:一是存储开
销很大。例如对每个像素使用的图像块的大小为 15×15,然后不断滑动窗口,
每次滑动的窗口给 CNN 进行判别分类,因此则所需的存储空间根据滑动窗口的
次数和大小急剧上升。二是计算效率低下。相邻的像素块基本上是重复的,针对
每个像素块逐个计算卷积,这种计算也有很大程度上的重复。三是像素块大小的
限制了感知区域的大小。通常像素块的大小比整幅图像的大小小很多,只能提取
一些局部的特征,从而导致分类的性能受到限制。更重要的是不能精确判定物体
的位置轮廓。
2015 年 Jonathan Long 等提出的全卷积网络(Fullyconvolutional Networks,
FCN)则是从抽象的特征中恢复出每个像素所属的类别。与经典的 CNN 在卷积
层之后使用全连接层得到固定长度的特征向量进行分类不同,FCN 可以接受任
意尺寸的输入图像,采用反卷积层对最后一个卷积层的 FeatureMap 进行上采样,
使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测,同时
也保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。
FCN 从图像级别的分类进一步延伸到像素级别的分类,从而有效地解决了语义
级别的图像分割(semantic segmentation)问题。
CNN 网络中的后三层都是一维的向量,计算方式不再采用卷积,所以丢失
174

