Page 109 - 事业单位档案数字化管理与实践
P. 109

第四章  数字化转型背景下档案信息安全



               跃居世界第一,通过流量流向对用户进行分析,根据用户需求与喜好推荐视频、
               商品等已经是惯用的商业经营手段。而在实际社会生活实践中,大数据分析对个
               人信息的使用往往未经用户的同意,对用户而言难以形成有效且实质性的知情机

               制,用户面临的是被动输出的风险,用户画像通过数据流量流向的输出,能够准
               确地计算出用户的兴趣爱好从而为用户推荐适合且符合用户喜好的商品、视频、
               新闻等。但在这个过程中,用户处于被大数据掌控的互联网世界,被动接受互联
               网的推送,丧失主动选择的权利,对用户的行为和选择产生巨大影响,削弱个人

               自治。

                   三、档案信息开放利用安全问题

                   (一)档案信息语义关联负影响

                   1. 数据关联分析导致隐私泄露
                   近年来,数据挖掘技术在档案领域的应用非常广泛,它能够通过分析和比较
               档案数据之间的关系,归纳出相同的特征,从中提炼出有意义的抽象的描述。这
               种技术能够帮助档案工作者从海量的档案信息中提取有用的、满足自己需求的信

               息。从数据挖掘的过程来看,档案工作者必须事先确定信息主题,并按照其目标
               和要求对相关主题进行界定,同时收集、抽取大量的文件资料,然后利用聚类分
               析方法对模型进行分类,并将其归类到不同的类别中。最后,将需求分类模型与
               使用者使用资讯相结合,对其进行差异性分析、偏差识别,剔除大量无关资料,

               从而得到有效的挖掘结果。在此过程中,数据挖掘必然会对使用者的隐私权造成
               损害。由于用户使用数字文件的时候,会涉及用户的姓名、工作、学历、兴趣等
               诸多方面的信息,如果用户的个人信息被泄露,将会对用户造成很大的负面影响。
                   2. 智能鉴定不精确
                   我国国家档案馆(室)档案开放数量由 2010 年的 6306.4 万卷增长到 2019

               年的 13171.6 万卷,十年间增长了 108%,档案的开放率却由 2010 年的 20.5% 下
               降到 2019 年的 16.0%,而我国档案馆藏数量从 2010 年的 30757.3 万卷增长到了
               2019 年的 82850.7 万卷,档案馆藏增长率高达 169%。从数据显示说明,档案开

               放的速度远远跟不上档案产生的速度。人工智能鉴定技术在档案开放环节的使用,
               并没有本质上解决档案开放率低的问题,这是由于人工智能智能按照既定的程序
               处理结构化的数据,而并不能像人脑一样对非结构化的数据进行处理,因此,尽



                                                                                   ·101·
   104   105   106   107   108   109   110   111   112   113   114