Page 141 - 大数据背景下网络安全问题研究
P. 141

» 第五章  机器学习在网络信息安全中的应用


























                                              图 5-3 决策树结构

                   决策树的构造是一个递归的过程,有3种情形会导致递归返回:
                   一是当前结点包含的样本全属于同一类别,这时直接将该节点标记为叶节点,并
               设为相应的类别(无需划分)。

                   二是当前属性集为空,或是所有样本在所有属性上取值相同,这时将该节点标记
               为叶节点,并将其类别设为该节点所含样本最多的类别(无法划分)。
                   三是当前结点包含的样本集合为空,这时也将该节点标记为叶节点,并将其类别

               设为父节点中所含样本最多的类(不能划分)。
                   决策树可以进行自学,不需要任何专家知识,可以根据设备自行生成决策系统。
               决策树算法是以实例为基础的归纳学习算法,以表达的知识简单直观、高推理效率、
               易于提取显示规则、计算量相对较小、可以显示重要决策属性和较高的分类准确率等

               优点而得到广泛的应用。董明提出了一种利用属于模式识别范畴的决策树C4.5法进行
               油浸式电力变压器故障诊断的方法,实现了变压器故障由粗到细的逐级划分,有利于
               提高诊断的准确性。

                   决策树算法在信息增益进行选择时,可能出现的偏向问题,会对取值较多的属
               性有所偏向,在某些特殊的情况下,通过其确定出的信息使用价值并不高,因此可以
               与其他算法结合,实现更好的故障诊断。刘伟等提出一种基于决策树与模糊推理脉冲

               神经网络的输出电网故障诊断方法,结果表明该方法在单类型和多类型故障信息丢失
               时,依然能够正确诊断出故障元件。
                   (2)基于支持向量机的故障诊断方法

                   支持向量机是一种基于统计学习理论的有监督学习方法,在1995年由苏联教授
               Cortes和Vapnik提出,由于在分类任务中的卓越性能,很快成为机器学习的主流技


                                                                                         • 129 •
   136   137   138   139   140   141   142   143   144   145   146