Page 93 - 档案学理论发展与创新
P. 93
第三章 档案数字化建设及信息安全研究
(三)档案信息传输过程安全问题
1. 非结构化数据传输困难
(1)数据量大
据统计,非结构数据的总量要远超过结构化数据和半结构化数据量。从档案
层面来看,数字化转型对档案事业发展产生了颠覆性的变革,“双轨制”向“单轨制”
的转变,表明电子档案的地位有了进一步的提升。从档案载体形势来看,尽管电
子档案载体相较于实体档案载体具有相当大的优势,如容量大,空间占比小等,
但相较于纸质档案而言,电子档案庞大的数据量成为档案工作中极大的困扰。尤
其是面临庞大的非结构化数据,无论是其移交和接收都存在很大的安全问题。
(2)对系统依赖性高
由于非结构化数据本身的特性是无法使用二维表结构进行表达的,而是以各
种类型的文件或者文件夹的形式存在,因此非结构化文件需要有能够接纳不同结
构类型的文件的系统才能进行文件的传输。并且由于文件类型的不同,非结构化
文件彼此之间的兼容性差,比如以 doc 格式保存的档案文件需要用 Word 或 WPS
才能查看,而 PDF 格式的文档就要使用专门的 PDF 阅读器才能查看,如果应用
软件出现升级情况,对于相应文档也会因版本不同而出现无法阅读的问题。在这
过程中,对系统的要求是极高的,但就目前中国档案信息系统的发展来看,尚未
出现能够完全兼容全部类型档案的系统,对不同档案信息类型的传输和接收,依
然主要依靠人工对其进行分类。
2. 数据流量流向定向分析
(1)隐私泄露的风险
数字化转型背景下,计算机技术飞速发展,社会生活的衣、食、住、行的各
个方面都可以通过智能设备借助互联网来进行。在这个过程中产生了大量的数据
信息,而在大量数据信息的背后,是作为大数据时代利用大数据进行算法演绎的
结果。数据分析公司可以通过动态展示传输数据、利用数据、监控用户访问和利
用行为,用概率算法推论出用户个人信息,由于档案信息是不加修饰的原始信息,
因此大数据分析存在很高的契合性,这种高契合性的特点使个人信息或公司信息
完全暴露在互联网之中,用户将面临丧失隐私权的风险,同时在对用户数据抽取、
分析等一系列过程中,很容易造成用户隐私数据的泄露。
-81-

