Page 93 - 档案学理论发展与创新
P. 93

第三章  档案数字化建设及信息安全研究




                 (三)档案信息传输过程安全问题
                 1. 非结构化数据传输困难
                 (1)数据量大

                 据统计,非结构数据的总量要远超过结构化数据和半结构化数据量。从档案
             层面来看,数字化转型对档案事业发展产生了颠覆性的变革,“双轨制”向“单轨制”
             的转变,表明电子档案的地位有了进一步的提升。从档案载体形势来看,尽管电
             子档案载体相较于实体档案载体具有相当大的优势,如容量大,空间占比小等,

             但相较于纸质档案而言,电子档案庞大的数据量成为档案工作中极大的困扰。尤
             其是面临庞大的非结构化数据,无论是其移交和接收都存在很大的安全问题。
                 (2)对系统依赖性高
                 由于非结构化数据本身的特性是无法使用二维表结构进行表达的,而是以各

             种类型的文件或者文件夹的形式存在,因此非结构化文件需要有能够接纳不同结
             构类型的文件的系统才能进行文件的传输。并且由于文件类型的不同,非结构化
             文件彼此之间的兼容性差,比如以 doc 格式保存的档案文件需要用 Word 或 WPS
             才能查看,而 PDF 格式的文档就要使用专门的 PDF 阅读器才能查看,如果应用

             软件出现升级情况,对于相应文档也会因版本不同而出现无法阅读的问题。在这
             过程中,对系统的要求是极高的,但就目前中国档案信息系统的发展来看,尚未
             出现能够完全兼容全部类型档案的系统,对不同档案信息类型的传输和接收,依
             然主要依靠人工对其进行分类。

                 2. 数据流量流向定向分析
                 (1)隐私泄露的风险
                 数字化转型背景下,计算机技术飞速发展,社会生活的衣、食、住、行的各
             个方面都可以通过智能设备借助互联网来进行。在这个过程中产生了大量的数据

             信息,而在大量数据信息的背后,是作为大数据时代利用大数据进行算法演绎的
             结果。数据分析公司可以通过动态展示传输数据、利用数据、监控用户访问和利
             用行为,用概率算法推论出用户个人信息,由于档案信息是不加修饰的原始信息,
             因此大数据分析存在很高的契合性,这种高契合性的特点使个人信息或公司信息

             完全暴露在互联网之中,用户将面临丧失隐私权的风险,同时在对用户数据抽取、
             分析等一系列过程中,很容易造成用户隐私数据的泄露。





                                                                                  -81-
   88   89   90   91   92   93   94   95   96   97   98