Page 188 - 测绘新技术的理论与实践研究
P. 188

测绘新技术的理论与实践研究

            由联合概率分布可以求出条件概率分布,从而得到预测的模型。这种方法一般建

            立在统计学和贝叶斯理论的基础之上。典型的模型有朴素贝叶斯、混合高斯模型
            和马尔科夫模型等。无监督生成模型通过学习真实数据的本质特征,从而刻画出
            样本数据的分布特征,生成与训练样本相似的新数据。生成模型的参数远远小于
            训练数据的量,因此模型能够发现并有效内化数据的本质,从而生成数据。生成

            式模型在无监督学习方面占据重要的位置,可以用于在没有目标类标签信息的情
            况下捕捉到数据的高阶相关性。

                (2)生成式对抗网络的原理
                生成式对抗网络(Gcncrative adversarial nctworks,GAN)是 Goodfellow 提
            出的一种生成式模型。GAN 采取了与其他生成方法不同的思路:对抗训练。网
            络由两个“对抗式”模型组成:一个生成式模型和一个判别式模型,生成式模型

            捕捉样本数据的分布,学习从随机噪声向量产生与训练数据相似的样本,判别式
            模型估计一个样本来自训练数据(而非生成数据)的概率。对抗的目标是,生成
            式模型提高判别误差,判别式模型降低判别误差。

                (3)GAN 的优点和缺点
                传统的生成模型存在两大困难:一是需要大量的先验知识进行建模,而建模
            的好坏直接影响生成模型的表现;二是真实世界的数据往往很复杂,需要用来拟
            合模型的计算量非常庞大,甚至难以承受。GAN 很好地避开了这两个难题。判

            别模型的存在,使得 GAN 中的生成模型不再需要对真实数据的先验知识和复杂

            性进行建模,也能学习去逼近真实数据,最终让其生成的数据达到以假乱真的
            地步。

                GAN 的优点:
                一是传统的生成式模型一般需要使用马尔科夫链进行训练,效率低,一定程

            度上限制了其应用。GAN 仅用反向传播和 Dropout 来训练模型,生成模型通过
            前向传播来生成样本,不需要近似推理和马尔科夫链。

                二是 GAN 是一个非常灵活的设计框架,各种类型的损失函数都可以整合到

            GAN 模型当中,这样使得针对不同的任务,可以设计不同类型的损失函数,都
            会在 GAN 的框架下进行学习和优化。
                三是最重要的一点,当概率密度不可计算的时候,传统依赖于数据自然性解


            176
   183   184   185   186   187   188   189   190   191   192   193