Page 170 - 大数据背景下计算机信息安全及防护

P. 170

大数据背景下计算机信息安全及防护
Computer Information Security and Protection in the Context of Big Data

（二）算法操控挑战
人工智能时代，除了严峻的数据安全问题之外，算法的统计性质所带来的不
可控性、人工智能系统的自主学习性与深度学习黑匣子模型的不可解释性，也成
了导致用户信任危机的新要素。

着眼技术研发层面，实现通用人工智能创新发展的技术途径主要是数据与算
法两个方面。如前所述，数据问题主要集中在隐私保护和安全、数据偏见以及由
此带来的不公平，而算法问题则在于可解释性与稳健性。从底层技术逻辑的角度
来看，算法在生成式人工智能服务技术训练的硬件基础设施、应用程序中均扮演

着核心角色，塑造了用户的习惯与价值观。算法公平性的背后存在人为和非人为
两种基本因素。如果说企业利用人工智能进行大数据“杀熟”，是可控的企业道
德问题，那么大部分算法带来的挑战，则很大程度源自人工智能系统本身的不可
控技术缺陷。所谓的不可控是指，人工智能模型在决策过程中存在黑箱问题，即

推理过程不透明。
首先，算法缺乏稳定性。针对生成式人工智能服务的数据和系统存在多种攻
击方式，例如病毒攻击、对抗攻击、后门攻击等。举例来说，通过向模型中投喂
恶意评论，便可以从源头数据上影响推荐算法的判断，输出不准确的推荐结果。

另外，干扰的形式不限于数字形式，也存在物理层面的干扰，如通过打印对抗样
本等手段，直接对自动驾驶和人脸识别系统造成物理层面的干扰。
其次，算法的可解释性尚待完善。以深度学习为代表的机器学习算法，本质
上是一个端到端的黑箱。一方面，人们对拥有巨大参数量的大模型内部的算法迭

代方式和运作机理尚不清楚；另一方面，人工智能算法做出决策时具体受到数据
库中哪些数据的影响，人们也不清楚。譬如，曾有实验者向 GPT-3（自然语言处
理模型）提问“新冠疫情何时结束”，它的回答是“2023 年 12 月 31 日”。但
答案的依据是什么？研究者无从解释，也自然难保其准确率。

最后，算法偏见与歧视问题尚待解决。算法偏见与歧视的产生具有内外多重
影响因素。一方面，若算法研发者在开发阶段设置了具有歧视性的因素或者错误
设置了某些参数，会导致算法天然具有歧视偏见的导向；另一方面，生成式人工
智能在大规模收集数据的过程中，数据的不全面会导致算法进行学习后产生片面

的结果，由于生成式人工智能的重要特点就是根据反馈结果不断优化生成内容，
因此外界的反馈结果中一旦含有偏见与歧视，也将影响最终的生成内容。基于此，

·160·

165 166 167 168 169 170 171 172 173 174 175