Page 188 - 测绘新技术的理论与实践研究

P. 188

测绘新技术的理论与实践研究

由联合概率分布可以求出条件概率分布，从而得到预测的模型。这种方法一般建

立在统计学和贝叶斯理论的基础之上。典型的模型有朴素贝叶斯、混合高斯模型
和马尔科夫模型等。无监督生成模型通过学习真实数据的本质特征，从而刻画出
样本数据的分布特征，生成与训练样本相似的新数据。生成模型的参数远远小于
训练数据的量，因此模型能够发现并有效内化数据的本质，从而生成数据。生成

式模型在无监督学习方面占据重要的位置，可以用于在没有目标类标签信息的情
况下捕捉到数据的高阶相关性。

（2）生成式对抗网络的原理
生成式对抗网络（Gcncrative adversarial nctworks，GAN）是 Goodfellow 提
出的一种生成式模型。GAN 采取了与其他生成方法不同的思路：对抗训练。网
络由两个“对抗式”模型组成：一个生成式模型和一个判别式模型，生成式模型

捕捉样本数据的分布，学习从随机噪声向量产生与训练数据相似的样本，判别式
模型估计一个样本来自训练数据（而非生成数据）的概率。对抗的目标是，生成
式模型提高判别误差，判别式模型降低判别误差。

（3）GAN 的优点和缺点
传统的生成模型存在两大困难：一是需要大量的先验知识进行建模，而建模
的好坏直接影响生成模型的表现；二是真实世界的数据往往很复杂，需要用来拟
合模型的计算量非常庞大，甚至难以承受。GAN 很好地避开了这两个难题。判

别模型的存在，使得 GAN 中的生成模型不再需要对真实数据的先验知识和复杂

性进行建模，也能学习去逼近真实数据，最终让其生成的数据达到以假乱真的
地步。

GAN 的优点：
一是传统的生成式模型一般需要使用马尔科夫链进行训练，效率低，一定程

度上限制了其应用。GAN 仅用反向传播和 Dropout 来训练模型，生成模型通过
前向传播来生成样本，不需要近似推理和马尔科夫链。

二是 GAN 是一个非常灵活的设计框架，各种类型的损失函数都可以整合到

GAN 模型当中，这样使得针对不同的任务，可以设计不同类型的损失函数，都
会在 GAN 的框架下进行学习和优化。
三是最重要的一点，当概率密度不可计算的时候，传统依赖于数据自然性解

176

183 184 185 186 187 188 189 190 191 192 193