Page 176 - 大数据背景下计算机信息安全及防护

P. 176

大数据背景下计算机信息安全及防护
Computer Information Security and Protection in the Context of Big Data

作为社会核心资产之一，数据安全的重要性不断提升。数据安全风险主要来自难
以保证数据质量和缺乏数据保护能力。一方面，数据的质量会影响人工智能输出
的准确率，如数据投毒、对抗样本攻击等。数据投毒是指在训练数据中加入精心

构造的异常数据污染原有的训练数据，对抗样本攻击是指在输入样本中添加细微
的、通常无法识别的干扰诱导模型产生错误输出结果。另一方面，数据处理流程

保护能力弱。人工智能海量数据持续累积的趋势仍在继续，超范围采集问题仍然
存在，采集的数据往往涉及生物特征、用户行为、生产经营等高敏感数据，使得

人工智能面临的数据安全挑战愈发不容忽视。同时数据存储、传输等环节存在安
全漏洞或者被攻击造成数据泄漏，存在隐私保护的安全风险。
（三）算法安全

人工智能算法是指基于数据“学习”人工智能模型的过程。算法通过拟合数
据集的方式“学习”，常见的人工智能算法包括：线性回归、决策树、贝叶斯网

络、深度学习、强化学习、推荐算法、深度合成算法等。算法安全风险主要来自
无法完全保证算法的安全性、可靠性、可信赖性。由于人为编写的人工智能算法
程序不可避免地存在问题，常见的如算法偏见歧视、算法漏洞等。算法偏见歧视

是指由于算法的设计者或开发人员对事物的认知存在主观上的某种偏见，或者不
经意使用了带有偏差的训练数据集等原因，造成模型准确性下降或分类错误，甚

至在模型使用时产生了带有歧视性的结果。如果将算法应用在犯罪评估、信用贷
款、雇佣评估等关乎人民切身利益的场合，其产生的歧视可能会严重危害个人权
益。算法漏洞可能被不法分子利用攻击人工智能应用。

（四）模型安全
人工智能模型是指在训练数据上运行人工智能算法的输出，表示人工智能算

法所学到的内容，如用于进行预测所需的规则、权重参数等数据。模型安全风险
主要来自难以保证模型不被窃取。人工智能模型作为数据和算法“学习”得到的

载体，并以实体文件的形态存在，存在被窃取和后门攻击的安全风险。模型窃取
如通过逆向攻击获取模型的参数及训练数据，通过成员推断攻击判断窃取训练数

据信息等。后门攻击一般是指利用后门将秘密行为植入经过训练的机器学习模型，
由于后门攻击具有较强的隐蔽性，其安全威胁也更加严峻。

·166·

171 172 173 174 175 176 177 178 179 180 181