Page 189 - 测绘新技术的理论与实践研究

P. 189

第五章多源遥感数据获取技术研究

释的一些生成模型就不可以在上面进行学习和应用。但是 GAN 在这种情况下依

然可以使用，这是因为 GAN 引入了一个非常聪明的内部对抗的训练机制，可以
逼近一些不是很容易计算的目标函数。
GAN 虽然不再需要预先建模，但这个优点同时也带来了一些麻烦。那就是
尽管它用一个随机噪声作为先验，但生成模型如何利用这个，是无法控制的。也

就是说，GAN 的学习模式太过于自由，使得 GAN 的训练过程和训练结果很多时
候都不太可控。GAN 面临的最大问题是不稳定，很多情况下都无法收敛。原因

是使用的优化方法很容易只找到一个局部最优点，而不是全局最优点，或者有些
算法根本就没法收敛。
GAN 已经成为人工智能学界一个非常热门的研究方向，其中一个最重要的
原因就是 GAN 为无监督学习提供了一个强有力的算法框架，而无监督学习被广
泛认为是通往人工智能重要的一环。Faccbook 人工智能研究院的著名学者 Yann

LeCun 更是称之为“过去十年间机器学习领域最让人激动的点子”。
2. 条件生成式对抗网络

前面提到，GAN 的缺点是太过自由，训练可能不稳定，对于较大的图像，
基于简单 GAN 的方式不容易控制。为了提高训练的稳定性，一个很自然的处理
就是改变学习方法：把无监督的 GAN 变成监督或者半监督的。这便可以为 GAN
的训练加上一点点束缚，或者说加上一点点目标。Mirza 等提出了条件生成式对

抗网络（Conditional Generative Adversarial Ncts，CGAN），在生成模型和判别模
型中均引入条件变量 y，这个 y 就是数据的一种标签。这个简单直接的改进被证
明非常有效，因为学习一个条件概率 P（xly）远比一个单独的 P（x）容易得多。

实际运用中，只需要一部分有标签数据就能大幅提升 GAN 的训练效果。这种部
分数据添加标签也被称为半监督学习。
生成对抗网络一般是根据随机噪声来生成特定类型的图像等实例，条件生成
式对抗网络则是根据一定的输入来限定输出。在非条件生成模型中，无法控制其

生成数据的模式。使用附加信息作为模型的条件变量，可以引导数据的生成过
程。给 GAN 加上条件，让生成的样本符合预期。这个条件可以是类别标签，也

可以是其他的多模态信息（例如，对图像的描述语言）等。如图 5-5 所示，通过
将额外信息 y 输送给判别模型和生成模型，作为输入层的一部分，从而实现条件
GAN。在生成模型中，先验输入噪声 z 和条件信息 y 联合组成了联合隐层表征。

177

184 185 186 187 188 189 190 191 192 193 194