Page 49 - 档案数字化管理模式与理论研究
P. 49

第二章  档案管理实践创新的思考



              部署云服务器。企业的 IT 部门负责服务器的运行和维护,对于访问的权限进行
              严格控制与分配。云存储解决了企业档案的大数据存储,提高了访问速度。
                  (二)大数据对企业档案管理流程的影响
                  1. 大数据对档案收集的影响

                  大数据技术下的档案信息主要有两个来源:一是各种档案的数字化,二是接
              收到的原始数字文件。目前,档案资料的来源还取决于纸质档案的数字化。通过
              扫描纸载体的文件,数据和照片文件可以转换成数字格式,通过语音识别和视频
              采集,音频和视频文件可以转换成数字信号,并且诸如奖章、证书等物理文件也

              可以通过上述方式转换。在大数据时代,档案数据的来源将集中在接收原始电子
              文件上。通过文件系统与其他业务信息系统的紧密联系,从而实现数字档案的自
              动化分类,保证了实时性与准确性。例如,在 PDM 系统和 OA 系统中,文件传
              输和归档功能被嵌入,并与文件系统建立实时通信接口。电子信息档案在运行过

              程中复杂度较高,在实施过程中,信息文件的获取应从数据类型、通信方式和需
              求三个维度来考虑。从数据类型,我们应该同时支持不同的结构化数据。从通信
              方式来看,建立与档案信息提供系统的数据通信,以实现数据采集和数据推送以
              及接收功能。当完成数据的接收,需要实时自动地完成数据的存储。大数据时代

              中,文件数据种类繁多,质量参差不齐。企业在注重自动化和实时性的同时,必
              须加强档案的规范化管理。根据电子文件管理的需要,制定了文件一体化、电子
              文件管理系统和数字档案识别系统等相关的规章制度,以确保文件的安全性、高
              效性和真实性。

                  2. 大数据对档案存储的影响
                  在大数据时代,档案类型越来越多,数据量逐渐增大。传统的数据库,如
              MySQL,已经不便于组织和对所有类型的数据进行操作,不能用于深度分析数据。
              此外,处理大规模的存档数据,如存储和分析等操作,并行性是唯一选择。这种

              并行处理不仅跨多个数据库,而且更重要的是它依赖于大量节点的并行处理,通
              过交叉节点来提高性能。一个由大量节点组成的分布式计算网络,对于系统本身
              而言维护的难度与压力是很大的,即使成本不是问题,节点故障,网络故障非常
              普遍的。高的容错率保证变得尤为重要,与此同时系统的大规模横向扩展使得关

              系数据库系统并不能应对这些需求。因此,传统数据库的文件管理的方式与类型
              以及信息的存储量已经不能满足大数据的管理。引入大数据管理系统来应对档案


                                                                                      37
   44   45   46   47   48   49   50   51   52   53   54