Page 116 - 档案学理论发展与创新
P. 116

D  档案学理论发展与创新
             evelopment and Innovation of Archival Science Theory


            术在综合档案信息化建设过程中能够发挥的作用还十分有限,既有人为因素,也
            有技术因素。我们应采取有针对性策略,提升综合档案信息化水平,实现综合档
            案信息资源的合理开发和利用,为各项工作开展提供精准的综合档案信息服务。



                         第四节  大数据时代电子档案建设要点



                一、概念界定

                (一)大数据的概念
                大数据又称“巨量资料”“海量资料”,指的是所涉及的资料量规模巨大到

            无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理,并整理成为
            帮助用户筛选决策的积极资讯。“大数据”是由数量巨大、结构复杂、类型众多
            数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共
            享,交叉复用,形成的智力资源和知识服务能力。

                (二)大数据的特点
                “大数据”是继云计算、物联网之后信息技术产业又一次颠覆性的技术变革。
            大数据时代数据成为核心的资产,对各行业传统业务模式形成挑战,如果不能运

            用大数据理解用户需要并高效分析作出判断,将对事业发展、行业决策、业务流
            程形成巨大的阻碍力量。一是数据体量巨大。当前,典型个人计算机硬盘的容量
            为 TB 量级,而一些大企业的数据量已经接近 EB 量级。二是数据类型繁多。这
            种类型的多样性也让数据被分为结构化数据和非结构化数据。除了以文本为主的

            结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理
            位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。三是价值密
            度低。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数

            据背景下亟待解决的难题。四是处理速度快。这是大数据区分于传统数据挖掘的
            最显著特征。在如此海量的数据面前,处理数据的速度和效率就是行业的生命。
                (三)电子档案的概念

                电子档案是指通过计算机磁盘等设备进行存储,与纸质档案相对应、相互关
            联的通用电子图像文件集合。在大数据背景下,电子档案是具备数量巨大、结构
            复杂、类型众多特征的数据集合。



            -104-
   111   112   113   114   115   116   117   118   119   120   121