Page 103 - 档案学理论发展与创新
P. 103
第三章 档案数字化建设及信息安全研究
第三节 档案数字化建设及技术应用
一、档案管理数字化的基础理论
(一)大数据观
大数据时代到来的最大最显著特征就是数据量的剧增,大到我们采用一般的
方法和技术无法对其进行描述和处理。大数据时代预言家维克托对大数据下的定
义是不采用随机分析法这样的捷径而使用所有数据的方法,这个定义明确地表示
出大数据时代的数据用的不再是抽样数据,而是全数据。大数据倡导的是一切数
据皆有用。作为一个新生的理念,目前很多人对大数据的认识和理解有些偏颇,
对相关问题存在疑惑。一是大数据一定非常大。其实,大数据并非总是说有数百
个 TB 才算得上,根据实际使用情况,有时候数百个 GB 的数据也可称为大数据,
主要看第三个维度——速度或时间维度。因而大数据并非对数据量大小的定量描
述,而在于快速获取数据价值的程度。二是大数据越多越好。对于大数据研究来
说,解决一个问题的数据规模有一个阈值,数据少于这个阈值,问题解决不了;
达到这个阈值,就可以解决以前解决不了的问题;超过这个阈值,对解决问题也
没有更多的帮助。所以,在对需要解决的问题进行相关数据分析时,重点是要对
数据进行科学分类、优化整合而不是为了去获取更多的数据,多也无益。三是大
数据是绝对的。直至目前,大数据的定义尚无统一标准,大数据说法也是针对现
有的思维、资源、方法和技术而言的,随着互联网不断发展,数据处理工具和技
术、存储空间和处理能力的提升,大数据的定义必然会因为人的见识和网的先进
一次又一次发生改变,因此大数据绝对不会一成不变。在档案管理领域,馆藏档
案就是档案部门的大数据,我们渴望所有信息资料都归档,但迫于人力物力财力
的束缚,传统的管理方法一直都是采取去粗取精的方式,从所有的信息资料中鉴
定出有利用价值的归入档案保存,那些无关紧要、没有利用价值的信息资料都被
剔除出档案收集的范围,这样做对当时来说是省时省力的无奈之举,但站在现在
甚至未来看,这种做法造成了相当一部分档案数据的损失。如果说过去是受主客
观条件的影响而没有遵循一切数据皆归档的原则的话,那么现在数据充足技术发
达的大数据时代,数据即档案,曾经单个数据没有意义,当它成为集体数据的一
份子时,谁知道会起到什么作用呢。档案部门应该尽快树立起档案大数据观。
-91-

