Page 141 - 大数据背景下网络安全问题研究
P. 141
» 第五章 机器学习在网络信息安全中的应用
图 5-3 决策树结构
决策树的构造是一个递归的过程,有3种情形会导致递归返回:
一是当前结点包含的样本全属于同一类别,这时直接将该节点标记为叶节点,并
设为相应的类别(无需划分)。
二是当前属性集为空,或是所有样本在所有属性上取值相同,这时将该节点标记
为叶节点,并将其类别设为该节点所含样本最多的类别(无法划分)。
三是当前结点包含的样本集合为空,这时也将该节点标记为叶节点,并将其类别
设为父节点中所含样本最多的类(不能划分)。
决策树可以进行自学,不需要任何专家知识,可以根据设备自行生成决策系统。
决策树算法是以实例为基础的归纳学习算法,以表达的知识简单直观、高推理效率、
易于提取显示规则、计算量相对较小、可以显示重要决策属性和较高的分类准确率等
优点而得到广泛的应用。董明提出了一种利用属于模式识别范畴的决策树C4.5法进行
油浸式电力变压器故障诊断的方法,实现了变压器故障由粗到细的逐级划分,有利于
提高诊断的准确性。
决策树算法在信息增益进行选择时,可能出现的偏向问题,会对取值较多的属
性有所偏向,在某些特殊的情况下,通过其确定出的信息使用价值并不高,因此可以
与其他算法结合,实现更好的故障诊断。刘伟等提出一种基于决策树与模糊推理脉冲
神经网络的输出电网故障诊断方法,结果表明该方法在单类型和多类型故障信息丢失
时,依然能够正确诊断出故障元件。
(2)基于支持向量机的故障诊断方法
支持向量机是一种基于统计学习理论的有监督学习方法,在1995年由苏联教授
Cortes和Vapnik提出,由于在分类任务中的卓越性能,很快成为机器学习的主流技
• 129 •

