Page 181 - 计算机应用软件开发技术研究

P. 181

第六章计算机网络安全动态评估关键技术研究

类别预测领域中。目前，机器学习的算法被大量应用在文本数据的研究中，通
过机器学习算法分析文档数据的相似度、文本的语义以及情感态度等。例如，
BaharumB 等人总结了机器学习在文本分类领域的研究进展，并探讨了在处理文

本分类中所遇常见问题的可能解决方法，肯定了这项技术未来的发展。由于计算
机漏洞描述数据是文本类型的数据，在漏洞描述的文本信息中，包含了大量关于
漏洞特征的信息，所以此领域研究人员利用机器学习的方法，对漏洞文本进行有
效的分析，从而实现对漏洞的类别预测。唐和平等人为了解决软件漏洞分类具有

重叠性等问题，对漏洞数据库 NVD（national vulnerability database）的漏洞描述
字段进行文本聚类，将 NVD 中四万条漏洞数据聚类成 45 类典型漏洞。廖晓锋
等人为了提高漏洞类别预测的准确性，采用了基于主题向量的 LDA 和支持向量
机 SVM 相结合的方法构建漏洞自动类别预测模型，表明此模型的准确率比直接

使用词向量构建的分类器准确率有所提高。ShuaiB 等人对此方法进行了改进，
将词语位置信息引入 WL-LDA 模型中，然后构建基于漏洞分布的 HT-SVM 多分
类器，以提升分类效果。刘春刚为了提取有效的漏洞特征词，提出了利用 CHI
进行漏洞文本的特征提取，并且构造出基于类别熵的二叉树 SVM 类别预测模

型，提高了预测的准确性。为了改进 SVM 分类器的不足，任远芳提出了基于遗
传算 GA 和 PSO 优化的支持向量机的漏洞类别预测模型，以提升漏洞类别预测
的准确率。为了进一步改善模型，WijayasekaraD 等人对 NaïveBayes 分类器在漏
洞数据上进行了测试，分析说明了此分类器根据漏洞描述文本信息实现类别预测

的可行性。高岭等使用了中国漏洞库的分类标准，使漏洞类别的预测更加合理，
并提出改进的 k-means 算法用于漏洞文本聚类。为了利用更多的属性来预测漏洞
类别，LiX 等人提出了基于漏洞特征包括错误、资源的积累消费、严格的时间要
求和复杂的环境与软件之间的互动的软件漏洞类别预测方法。为了得出最高 F-度

量的类别预测模型，DavariM 等人提出了基于激活漏洞条件的自动漏洞类别预测
框架，使用不同的机器学习技术，来标记未知漏洞。
（二）网络风险评估研究现状
对网络进行预先的风险评估和量化，是保障网络安全的基础。通过对网络

风险实现量化，实时的了解网络的风险状况，以预先采取防御措施对网络进行
防护。为了应对严峻的网络安全问题，学者们研究了各种各样评估网络风险的方
法。关于漏洞的评估方面较早在国际上起步，2000 年 Ritchey 等人首次提出了利

·169·

176 177 178 179 180 181 182 183 184 185 186