Page 103 - 档案学理论发展与创新
P. 103

第三章  档案数字化建设及信息安全研究




                           第三节  档案数字化建设及技术应用


                 一、档案管理数字化的基础理论


                 (一)大数据观
                 大数据时代到来的最大最显著特征就是数据量的剧增,大到我们采用一般的
             方法和技术无法对其进行描述和处理。大数据时代预言家维克托对大数据下的定

             义是不采用随机分析法这样的捷径而使用所有数据的方法,这个定义明确地表示
             出大数据时代的数据用的不再是抽样数据,而是全数据。大数据倡导的是一切数
             据皆有用。作为一个新生的理念,目前很多人对大数据的认识和理解有些偏颇,

             对相关问题存在疑惑。一是大数据一定非常大。其实,大数据并非总是说有数百
             个 TB 才算得上,根据实际使用情况,有时候数百个 GB 的数据也可称为大数据,
             主要看第三个维度——速度或时间维度。因而大数据并非对数据量大小的定量描
             述,而在于快速获取数据价值的程度。二是大数据越多越好。对于大数据研究来

             说,解决一个问题的数据规模有一个阈值,数据少于这个阈值,问题解决不了;
             达到这个阈值,就可以解决以前解决不了的问题;超过这个阈值,对解决问题也
             没有更多的帮助。所以,在对需要解决的问题进行相关数据分析时,重点是要对

             数据进行科学分类、优化整合而不是为了去获取更多的数据,多也无益。三是大
             数据是绝对的。直至目前,大数据的定义尚无统一标准,大数据说法也是针对现
             有的思维、资源、方法和技术而言的,随着互联网不断发展,数据处理工具和技
             术、存储空间和处理能力的提升,大数据的定义必然会因为人的见识和网的先进

             一次又一次发生改变,因此大数据绝对不会一成不变。在档案管理领域,馆藏档
             案就是档案部门的大数据,我们渴望所有信息资料都归档,但迫于人力物力财力
             的束缚,传统的管理方法一直都是采取去粗取精的方式,从所有的信息资料中鉴

             定出有利用价值的归入档案保存,那些无关紧要、没有利用价值的信息资料都被
             剔除出档案收集的范围,这样做对当时来说是省时省力的无奈之举,但站在现在
             甚至未来看,这种做法造成了相当一部分档案数据的损失。如果说过去是受主客

             观条件的影响而没有遵循一切数据皆归档的原则的话,那么现在数据充足技术发
             达的大数据时代,数据即档案,曾经单个数据没有意义,当它成为集体数据的一
             份子时,谁知道会起到什么作用呢。档案部门应该尽快树立起档案大数据观。



                                                                                  -91-
   98   99   100   101   102   103   104   105   106   107   108