Page 181 - 计算机应用软件开发技术研究
P. 181

第六章  计算机网络安全动态评估关键技术研究



             类别预测领域中。目前,机器学习的算法被大量应用在文本数据的研究中,通
             过机器学习算法分析文档数据的相似度、文本的语义以及情感态度等。例如,
             BaharumB 等人总结了机器学习在文本分类领域的研究进展,并探讨了在处理文

             本分类中所遇常见问题的可能解决方法,肯定了这项技术未来的发展。由于计算
             机漏洞描述数据是文本类型的数据,在漏洞描述的文本信息中,包含了大量关于
             漏洞特征的信息,所以此领域研究人员利用机器学习的方法,对漏洞文本进行有
             效的分析,从而实现对漏洞的类别预测。唐和平等人为了解决软件漏洞分类具有

             重叠性等问题,对漏洞数据库 NVD(national vulnerability database)的漏洞描述
             字段进行文本聚类,将 NVD 中四万条漏洞数据聚类成 45 类典型漏洞。廖晓锋
             等人为了提高漏洞类别预测的准确性,采用了基于主题向量的 LDA 和支持向量
             机 SVM 相结合的方法构建漏洞自动类别预测模型,表明此模型的准确率比直接

             使用词向量构建的分类器准确率有所提高。ShuaiB 等人对此方法进行了改进,
             将词语位置信息引入 WL-LDA 模型中,然后构建基于漏洞分布的 HT-SVM 多分
             类器,以提升分类效果。刘春刚为了提取有效的漏洞特征词,提出了利用 CHI
             进行漏洞文本的特征提取,并且构造出基于类别熵的二叉树 SVM 类别预测模

             型,提高了预测的准确性。为了改进 SVM 分类器的不足,任远芳提出了基于遗
             传算 GA 和 PSO 优化的支持向量机的漏洞类别预测模型,以提升漏洞类别预测
             的准确率。为了进一步改善模型,WijayasekaraD 等人对 NaïveBayes 分类器在漏
             洞数据上进行了测试,分析说明了此分类器根据漏洞描述文本信息实现类别预测

             的可行性。高岭等使用了中国漏洞库的分类标准,使漏洞类别的预测更加合理,
             并提出改进的 k-means 算法用于漏洞文本聚类。为了利用更多的属性来预测漏洞
             类别,LiX 等人提出了基于漏洞特征包括错误、资源的积累消费、严格的时间要
             求和复杂的环境与软件之间的互动的软件漏洞类别预测方法。为了得出最高 F-度

             量的类别预测模型,DavariM 等人提出了基于激活漏洞条件的自动漏洞类别预测
             框架,使用不同的机器学习技术,来标记未知漏洞。
                 (二)网络风险评估研究现状
                 对网络进行预先的风险评估和量化,是保障网络安全的基础。通过对网络

             风险实现量化,实时的了解网络的风险状况,以预先采取防御措施对网络进行
             防护。为了应对严峻的网络安全问题,学者们研究了各种各样评估网络风险的方
             法。关于漏洞的评估方面较早在国际上起步,2000 年 Ritchey 等人首次提出了利



                                                                                 ·169·
   176   177   178   179   180   181   182   183   184   185   186