Page 123 - 新时期档案管理理论与实践探析
P. 123
第四章 大数据在档案管理中的应用
档等概念都应满足这个条件);数据间应有一定的特征差别,不能具有同一性,
如基建档案中的图纸类数据等不符合这一要求。由于基建图纸类数据是通过建筑
设计软件产生的专业领域数据,所有图纸几乎都是由线条构成,在颜色、轮廓等
方面都没有明显的区分,特征非常不明显,因此这类数据应该排除在档案数据挖
掘范围之内。
2. 需求导向原则
档案数据挖掘应以用户的需求为导向,立足于满足与档案管理活动相关人员
的普遍需求,同时还应将未来可能出现的状况考虑进去,做到问题的及时应对。
档案数据挖掘主要以电子文件为对象,一旦进入无纸化时代,整个社会的信息流
将加快,单位时间内产生的电子文件将急剧增加,会直接增加档案管理的压力,
不仅给档案管理系统的稳定性带来了挑战,也影响着整个工作流程的可持续性。
由于档案管理从档案的收集、整理、著录、保管、鉴定到利用都是有秩序的流程,
任何一个环节的出错,都可能导致后续档案工作的无法开展,因此在档案数据挖
掘设计时,势必要将各个环节人员的需求都考虑进去,保证管理得有条不紊。
3. 成本效益原则
档案数据挖掘系统的开发与大部分信息系统一样,都需要投入大量的人力、
物力,需要充足的资金来维持。然而,无论是在政府机构还是企业内部,档案部
门一直处于边缘地位,可供规划使用的资金不是很多,因此在档案数据挖掘上投
入应量力而行,在满足多数人需求的情况,尽量降低研发所用的资金。同时,资
金的支持与其产生的效益相关,如若一个项目不能产生明显的效益,那么对于整
个机构来说,这就是一个失败的项目,对于资金的申请自然不能成功,因此在档
案数据挖掘的研发上应更偏向档案利用的目的,高效地利用过去所产生的所有文
件,在文化产品、辅助决策等方面都可以发挥档案应有的作用,如对于企业内部
的档案,通过数据挖掘可归纳出企业近几年的发展状况和规划,结合企业实际的
运营情况可适当做出有利于企业发展的建议,充当辅助决策的作用。
4. 档案保护原则
数据挖掘的数据来源是档案,但并不意味着要使用原始数据。对于档案来说,
原始数据有且只有一份,即使是拷贝后的电子文件,从数据的性质来说,该数据
也不是原来的数据。在档案数据挖掘过程中,档案数据的利用是必定是要进行,
因此整个过程可能会带来不可逆的后果,一旦档案数据遭到损坏,意味着整个档
·109·

