Page 127 - 大数据背景下网络安全问题研究
P. 127
» 第五章 机器学习在网络信息安全中的应用
网络学习、统计学习、决策树学习、规则学习。
(2)非结构化学习
以非结构化数据为输入,典型的非结构化学习有类比学习案例学习、解释学习、
文本挖掘、图像挖掘、Web挖掘等。
5.基于学习目标的分类
(1)概念学习
学习的目标和结果为概念,或者说是为了获得概念的学习。典型的概念学习主要
有示例学习。
(2)规则学习
学习的目标和结果为规则,或者为了获得规则的学习。典型规则学习主要有决策
树学习。
(3)函数学习
学习的目标和结果为函数,或者说是为了获得函数的学习。典型函数学习主要有
神经网络学习。
(4)类别学习
学习的目标和结果为对象类,或者说是为了获得类别的学习。典型类别学习主要
有聚类分析。
(5)贝叶斯网络学习
学习的目标和结果是贝叶斯网络,或者说是为了获得贝叶斯网络的一种学习。其
又可分为结构学习和多数学习。
二、机器学习的常见算法
(一)决策树算法
决策树及其变种是一类将输入空间分成不同的区域,每个区域有独立参数的算
法。决策树算法充分利用了树形模型,根节点到一个叶子节点是一条分类的路径规
则,每个叶子节点象征一个判断类别。先将样本分成不同的子集,再进行分割递推,
直至每个子集得到同类型的样本,从根节点开始测试,到子树再到叶子节点,即可得
出预测类别。此方法的特点是结构简单、处理数据效率较高。
(二)朴素贝叶斯算法
朴素贝叶斯算法是一种分类算法。它不是单一算法,而是一系列算法,它们都有
一个共同的原则,即被分类的每个特征都与任何其他特征的值无关。朴素贝叶斯分类
器认为这些“特征”中的每一个都独立地贡献概率,而不管特征之间的任何相关性。
然而,特征并不总是独立的,这通常被视为朴素贝叶斯算法的缺点。简而言之,朴素
• 115 •

