Page 220 - 计算机技术与网络安全研究
P. 220
计算机技术与网络安全研究
Computer Technology and Cyber Security Research
空洞卷积的优点是它可以保持空间分辨率。除了之前的几种方法,还有一种叫条
件随机场(Conditional RandomFields,CRFs)的方法来提升分割效果。
(二)机器学习
机器学习的基本思想是通过计算机对数据的学习来提升自身性能的算法。
机器学习中需要解决的最重要的 4 类问题是预测、聚类、分类和降维。机器学习
按照学习方法分类可分为:监督学习、无监督学习、半监督学习和强化学习。
1. 监督学习
监督学习指的是用打好标签的数据训练预测新数据的类型或值。根据预测
结果的不同可以分为 2 类:分类和回归。监督学习的典型方法有 SVM 和线性判别。
回归问题指预测出一个连续值的输出,例如可以通过房价数据的分析,根据样本
的数据输入进行拟合,进而得到一条连续的曲线用来预测房价。分类问题指预测
一个离散值的输出,例如根据一系列的特征判断当前照片是狗还是猫,输出值就
是1或者0。
2. 无监督学习
无监督学习是在数据没有标签的情况下做数据挖掘,无监督学习主要体现
在聚类。简单来说是将数据根据不同的特征在没有标签的情况下进行分类。无监
督学习的典型方法有 k -聚类及主成分分析等。k -聚类的一个重要前提是数据
之间的区别可以用欧氏距离度量,如果不能度量的话需要先转换为可用欧式距离
度量。主成分分析是一种统计方法。通过使用正交变换将存在相关性的变量,变
为不存在相关性的变量,转换之后的变量叫做主成分。其基本思想就是将最初具
有一定相关性的指标,替换为一组相互独立的综合指标。
3. 半监督学习
半监督学习根据字面意思可以理解为监督学习和无监督学习的混合使用。
事实上是学习过程中有标签数据和无标签数据相互混合使用。一般情况下无标签
数据比有标签数据量要多得多。半监督学习的思想很理想化,但是在实际应用中
不多。一般常见的半监督学习算法有自训练算法(Self - training)、基于图的半
监督算法(Graph-based Semi-supervised Learning)和半监督支持向量机(S3VM)。
4. 强化学习
随着 AlphaGo 的火热,强化学习成为了当前最火热的研究领域之一,强化学
习词热点居高不下。强化学习是通过与环境的交互获得奖励,并通过奖励的高低
212
212

