Page 181 - 计算机应用软件开发技术研究
P. 181
第六章 计算机网络安全动态评估关键技术研究
类别预测领域中。目前,机器学习的算法被大量应用在文本数据的研究中,通
过机器学习算法分析文档数据的相似度、文本的语义以及情感态度等。例如,
BaharumB 等人总结了机器学习在文本分类领域的研究进展,并探讨了在处理文
本分类中所遇常见问题的可能解决方法,肯定了这项技术未来的发展。由于计算
机漏洞描述数据是文本类型的数据,在漏洞描述的文本信息中,包含了大量关于
漏洞特征的信息,所以此领域研究人员利用机器学习的方法,对漏洞文本进行有
效的分析,从而实现对漏洞的类别预测。唐和平等人为了解决软件漏洞分类具有
重叠性等问题,对漏洞数据库 NVD(national vulnerability database)的漏洞描述
字段进行文本聚类,将 NVD 中四万条漏洞数据聚类成 45 类典型漏洞。廖晓锋
等人为了提高漏洞类别预测的准确性,采用了基于主题向量的 LDA 和支持向量
机 SVM 相结合的方法构建漏洞自动类别预测模型,表明此模型的准确率比直接
使用词向量构建的分类器准确率有所提高。ShuaiB 等人对此方法进行了改进,
将词语位置信息引入 WL-LDA 模型中,然后构建基于漏洞分布的 HT-SVM 多分
类器,以提升分类效果。刘春刚为了提取有效的漏洞特征词,提出了利用 CHI
进行漏洞文本的特征提取,并且构造出基于类别熵的二叉树 SVM 类别预测模
型,提高了预测的准确性。为了改进 SVM 分类器的不足,任远芳提出了基于遗
传算 GA 和 PSO 优化的支持向量机的漏洞类别预测模型,以提升漏洞类别预测
的准确率。为了进一步改善模型,WijayasekaraD 等人对 NaïveBayes 分类器在漏
洞数据上进行了测试,分析说明了此分类器根据漏洞描述文本信息实现类别预测
的可行性。高岭等使用了中国漏洞库的分类标准,使漏洞类别的预测更加合理,
并提出改进的 k-means 算法用于漏洞文本聚类。为了利用更多的属性来预测漏洞
类别,LiX 等人提出了基于漏洞特征包括错误、资源的积累消费、严格的时间要
求和复杂的环境与软件之间的互动的软件漏洞类别预测方法。为了得出最高 F-度
量的类别预测模型,DavariM 等人提出了基于激活漏洞条件的自动漏洞类别预测
框架,使用不同的机器学习技术,来标记未知漏洞。
(二)网络风险评估研究现状
对网络进行预先的风险评估和量化,是保障网络安全的基础。通过对网络
风险实现量化,实时的了解网络的风险状况,以预先采取防御措施对网络进行
防护。为了应对严峻的网络安全问题,学者们研究了各种各样评估网络风险的方
法。关于漏洞的评估方面较早在国际上起步,2000 年 Ritchey 等人首次提出了利
·169·

