Page 188 - 测绘新技术的理论与实践研究
P. 188
测绘新技术的理论与实践研究
由联合概率分布可以求出条件概率分布,从而得到预测的模型。这种方法一般建
立在统计学和贝叶斯理论的基础之上。典型的模型有朴素贝叶斯、混合高斯模型
和马尔科夫模型等。无监督生成模型通过学习真实数据的本质特征,从而刻画出
样本数据的分布特征,生成与训练样本相似的新数据。生成模型的参数远远小于
训练数据的量,因此模型能够发现并有效内化数据的本质,从而生成数据。生成
式模型在无监督学习方面占据重要的位置,可以用于在没有目标类标签信息的情
况下捕捉到数据的高阶相关性。
(2)生成式对抗网络的原理
生成式对抗网络(Gcncrative adversarial nctworks,GAN)是 Goodfellow 提
出的一种生成式模型。GAN 采取了与其他生成方法不同的思路:对抗训练。网
络由两个“对抗式”模型组成:一个生成式模型和一个判别式模型,生成式模型
捕捉样本数据的分布,学习从随机噪声向量产生与训练数据相似的样本,判别式
模型估计一个样本来自训练数据(而非生成数据)的概率。对抗的目标是,生成
式模型提高判别误差,判别式模型降低判别误差。
(3)GAN 的优点和缺点
传统的生成模型存在两大困难:一是需要大量的先验知识进行建模,而建模
的好坏直接影响生成模型的表现;二是真实世界的数据往往很复杂,需要用来拟
合模型的计算量非常庞大,甚至难以承受。GAN 很好地避开了这两个难题。判
别模型的存在,使得 GAN 中的生成模型不再需要对真实数据的先验知识和复杂
性进行建模,也能学习去逼近真实数据,最终让其生成的数据达到以假乱真的
地步。
GAN 的优点:
一是传统的生成式模型一般需要使用马尔科夫链进行训练,效率低,一定程
度上限制了其应用。GAN 仅用反向传播和 Dropout 来训练模型,生成模型通过
前向传播来生成样本,不需要近似推理和马尔科夫链。
二是 GAN 是一个非常灵活的设计框架,各种类型的损失函数都可以整合到
GAN 模型当中,这样使得针对不同的任务,可以设计不同类型的损失函数,都
会在 GAN 的框架下进行学习和优化。
三是最重要的一点,当概率密度不可计算的时候,传统依赖于数据自然性解
176

