Page 107 - 大数据背景下网络安全问题研究

P. 107

» 第四章网络攻击与漏洞利用

样本对其他不同模型的攻击也同样有效。
（四）针对人工智能自身安全问题的防护
随着数据量及算力不断提升，未来人工智能应用场景不断增多，人工智能自身安
全问题成为其发展的瓶颈，人工智能自身安全的重要性不言而喻。针对人工智能自身
在训练数据、开发框架、算法、模型及软硬件设备等方面的安全问题，目前较为常用

的防护手段有以下几点。
1.数据安全
分析异常数据与正常数据的差异，过滤异常数据；基于统计学方法检测训练数据

集中的异常值；采用多个独立模型集成分析，不同模型使用不同的数据集进行训练，
降低数据投毒攻击的影响等。
2.框架安全
通过代码审计、模糊测试等技术挖掘开发框架中存在的安全漏洞并进行修复；借

助白帽子、安全研究团队等社区力量发现安全问题，降低框架平台的安全风险。
3.算法安全
在数据收集阶段，对输入数据进行预处理，消除对抗样本中存在的对抗性扰动。

在模型训练阶段，使用对抗样本和良性样本对神经网络进行对抗训练，以防御对抗样
本攻击；增强算法的可解释性，明确算法的决策逻辑、内部工作机制、决策过程及
依据等。在模型使用阶段，通过数据特征层差异或模型预测结果差异进行对抗样本
检测；对输入数据进行变形转化等重构处理，在保留语义前提下破坏攻击者的对抗扰
动等。

4.模型安全
在数据收集阶段，加强数据收集粒度来增强训练数据中环境因素的多样性，增强
模型对多变环境的适应性。在模型训练阶段，使模型学习到不易被扰动的特征或者降

低对该类特征的依赖程度，提高模型鲁棒性；将训练数据划分为多个集合分别训练独
立模型，多个模型投票共同训练使用的模型，防止训练数据泄露；对数据/模型训练
步骤加噪或对模型结构进行有目的性的调整，降低模型输出结果对训练数据或模型的
敏感性，保护模型数据隐私；将水印嵌入模型文件，避免模型被窃取；通过模型剪枝

删除模型中与正常分类无关的神经元，减少后门神经元起作用的可能性，或通过使用
干净数据集对模型进行微调消除模型中的后门。在模型使用阶段，对输入数据进行预
处理，降低后门攻击可能性；在模型运行过程中引入随机性（输入/参数/输出），使
得攻击者无法获得模型的准确信息；混淆模型输出和模型参数更新等交互数据中包含

的有效信息，减少模型信息可读性；采用访问控制策略（身份验证、访问次数等）限
定对模型系统的访问，防止模型信息泄露；对模型文件进行校验或验证，发现其中存

• 95 •

102 103 104 105 106 107 108 109 110 111 112