Page 105 - 大数据背景下网络安全问题研究
P. 105
» 第四章 网络攻击与漏洞利用
7.基于人工智能的网络安全平台AI2
该平台结合无监督机器学习和有监督学习的方法,首先用无监督机器学习自主扫
描日志文件,分析人员确认扫描结果,并将确认结果纳入AI2系统,用于对新日志的
分析。该平台能检测出约85%的网络攻击。
8.基于机器学习的通用漏洞检测方法
这是第一个基于漏洞不一致性的通用漏洞检测方法。区别于已有漏洞检测方法,
该方法使用两步聚类来检测功能相似但不一致的代码片段,无需花费大量时间进行样
本收集、清理及打标签。同时,该方法采用手工分析聚类结果,以更快定位真正的漏
洞。该方法发现了开源软件中未知的22个漏洞。
9.基于深度学习的威胁情报知识图谱构建技术
利用深度置信网络DBN训练的模型,对威胁情报的实体和实体关系进行自动化抽
取。该方法较浅层神经网络的识别准确率有较大提高,比人工抽取的速率也有很大提
高,可为自动化构建威胁情报知识图谱提供有力的保障。
10.基于混合词向量深度学习模型的DGA域名检测方法
首次结合了DGA域名的字符级词向量和双字母组词向量,以提高域名字符串的信
息利用度,并设计了基于混合词向量方法的深度学习模型,模型由卷积神经网络CNN
和LSTM组成。实验证明该方法有着较好的特征提取能力与分类效果,并在一定程度
上缓解了数据不平衡带来的负面影响。从上述应用研究可以看出,目前人工智能应用
研究主要以恶意行为检测为主,在检测成果基础上不断提升响应处置、积极防御和威
胁预测的能力。
(三)针对人工智能自身安全问题的攻击
随着人工智能的广泛应用,由于技术不成熟及恶意应用导致的安全风险逐渐暴
露,包括深度学习框架中的软件实现漏洞、恶意对抗样本生成、训练数据投毒及数据
强依赖等。黑客可通过找到人工智能系统弱点以绕过防御进行攻击,导致人工智能所
驱动的系统出现混乱,形成漏判或者误判,甚至导致系统崩溃或被劫持。人工智能的
自身安全问题,主要体现在训练数据、开发框架、算法、模型及承载人工智能系统的
软硬件设备等方面,具体内容如下。
1.数据安全
数据集的质量(如数据的规模、均衡性及准确性等)对人工智能算法的应用至关
重要,影响着人工智能算法的执行结果。不好的数据集会使得人工智能算法模型无效
或者出现不安全的结果。较为常见的安全问题为数据投毒攻击,通过训练数据污染导
致人工智能决策错误。例如,垃圾邮件发送者通过在垃圾邮件中插入“好话”,实现
简单的“回避攻击”以绕过垃圾邮件过滤器中的分类器,从而使得恶意邮件逃避垃圾
• 93 •

