Page 185 - 测绘新技术的理论与实践研究

P. 185

第五章多源遥感数据获取技术研究

点。假设第一个隐藏层有 100 个节点（这个数量并不多），那么仅这一层就有

（1000×1000+1）×100~1 亿参数，实在是太多了。图像扩大一点，参数数量就
会多很多，因此它的扩展性很差。
2. 没有利用像素之间的位置信息
对于图像识别而言，每个像素和其周围像素的联系是比较紧密的，和离得很

远的像素的联系可能就很小了。如果一个神经元和上一层所有神经元相连，那么
就相当于对于一个像素来说，把图像的所有像素都等同看待，这不符合前面的假

设。当完成每个连接权重的学习之后，最终可能会发现，有大量的权重，它们的
值都是很小的（也就是说这些连接其实无关紧要）。努力学习大量并不重要的权
重，这样的学习必将是非常低效的。
3. 网络层数限制

网络层数越多，其表达能力越强，但是通过梯度下降方法训练深度全连接神
经网络很困难，因为全连接神经网络的梯度很难传递超过 3 层。因此，不可能得
到一个很深的全连接神经网络，也就限制了它的能力。

卷积神经网络（Conv olutional Neural Networks，CNN）以卷积内核为训练单
元，可以较好地解决上述问题。CNN 采用的策略主要有三个：
一是局部连接：每个神经元不再和上一层的所有神经元相连，而只和对应区
域一小部分神经元相连。这样的连接处理大大减少了参数；二是权值共享：一组

连接共享同一个权值，而不是每个连接有一个不同的权值。这样的设定又减少了
很多参数；三是下采样：使用 Pooling（池化）技术减少每层的样本数，进一步
减少参数数量，同时还可以提升模型的鲁棒性。

对于图像识别任务来说，卷积神经网络通过尽可能保留重要的参数，去掉大
量不重要的参数，来达到更好的学习效果。
卷积神经网络的层结构和全连接神经网络的层结构有很大不同。全连接神经
网络每层的神经元是按照一维排列的，也就是排成一条线；而卷积神经网络每层

的神经元是按照三维排列的，也就是排成一个长方体，有宽度、高度和深度。
CNN 的基本运行模式可以总结为：从前到后依次经过卷积层进行卷积，经

过 Pooling 层进行特征降维进而形成能够输入人工神经网络的特征向量，使之能
够形成人工神经网络全连接的输入，进而进行训练。
和全连接神经网络相比，CNN 的训练要复杂一些，但训练的原理是一样的：

173

180 181 182 183 184 185 186 187 188 189 190