Page 42 - 档案学理论发展与创新
P. 42

D  档案学理论发展与创新
             evelopment and Innovation of Archival Science Theory


            化分类,保证了实时性与准确性。例如,在 PDM 系统和 0A 系统中,文件传输
            和归档功能被嵌入,并与文件系统建立实时通信接口。电子信息档案在运行过程
            中复杂度较高,在实施过程中,信息文件的获取应从数据类型、通信方式和需求

            三个维度来考虑。从数据类型,我们应该同时支持不同的结构化数据。从通信方
            式来看,建立与档案信息提供系统的数据通信,以实现数据采集和数据推送以及
            接收功能。当完成数据的接收,需要实时自动地完成数据的存储。大数据时代中,
            文件数据种类繁多,质量参差不齐。企业在注重自动化和实时性的同时,必须加

            强档案的规范化管理。根据电子文件管理的需要,制定了文件一体化、电子文件
            管理系统和数字档案识别系统等相关的规章制度,以确保文件的安全性、高效性
            和真实性。
                2. 大数据对档案存储的影响

                在大数据时代,档案类型越来越多,数据量逐渐增大。传统的数据库。例如,
            MySQL,已经不便于组织和对所有类型的数据进行操作,不能用于深度分析数据。
            此外,处理大规模的存档数据,如存储和分析等操作,并行性是唯一选择。这种
            并行处理不仅跨多个数据库,而且更重要的是它依赖于大量节点的并行处理,通

            过交叉节点来提高性能。一个由大量节点组成的分布式计算网络,对于系统本身
            而言维护的难度与压力是很大的,即使成本不是问题,节点故障,网络故障非常
            普遍的。高的容错率保证变得尤为重要,与此同时系统的大规模横向扩展使得关
            系数据库系统并不能应对这些需求。因此,传统数据库的文件管理的方式与类型

            以及信息的存储量已经不能满足大数据的管理。引入大数据管理系统来应对档案
            的存储问题是很有前景与必要的。采用硬件的优势,可扩展并行处理技术,非关
            系模式存储数据的方式,并利用先进的机器学习方法和可视化技术对大数据进行
            直观表达与特征处理已经成为技术发展的新的导向。

                3. 大数据对档案利用的影响
                就目前的管理方式而言,文件数据的利用还停留在对目录的调查阶段,综
            合性的数据挖掘还有待深化。大数据的时代背景下,需要对文档信息进行快速查
            询,提取有价值有意义的应用,更重要的是解压并处理海量文件,从中分析出数

            据的价值以及有价值的知识,提供更为人性、智能化的信息服务,对企业决策水
            平和后续工作效率产生积极影响。在大数据背景下,档案系统中,除了多种非即
            时类型的文件数据外,还包括海量的即时用户行动数据,例如发帖、点击、购买



            -30-
   37   38   39   40   41   42   43   44   45   46   47