Page 116 - 新时期档案管理理论与实践探析
P. 116
新时期档案管理理论与实践探析
Analysis of Theory and Practice of Archives Management in the New Era
主要由以下几种方法得以体现。
(一)统计分析方法
指对数据源加以分析后得出可以帮助描述与判断其全部知识的方法。它以统
计学与概率论为基础依据,是十分精确的数据挖掘技术。其具有易于被接受,描
述结果精准等优点。
(二)关联规则方法
关联规则是指几个取值的变量间存有的规律性,其可分为简单关联、时序关
联和因果关联,其目的是找出数据间存有的潜在的关联。是一种相对操作简单,
且具有现实意义的方法。现被广泛使用于数据交易的分析环节中,将分析所产生
的结果用于辅助企业的运营策略。其主要算法包括:Aprion 算法、AprionTid 算法、
FP-Tree 算法。
(三)神经网络方法
神经网络是利用率较高的数据挖掘技术之一。神经网络系统分为输入、隐藏、
输出三层。其目的在于找寻一种研发与测试的模式类型。具有优化计算、聚类和
预测等功能。其难点在于需要利用庞大的数据源和漫长的时间去验证,也很难对
操作过程中得到的结构和规则加以解释,不易于人们的理解。但其能较好地对复
杂烦琐的问题加以预测,并有良好的处理噪声数据信息,对数据进行分类的功能。
被分为前馈式、反馈式和自组织神经网络,其在商界被广泛应用。
(四)粗糙集方法
是在 1982 年由波兰数学家 Z·Pawlak 提出的。其常被用于处理那些可能有
误的、含有噪声的数据,用以确定数据之间是否存有某种特定的关联性。通常对
描述那些不是很清晰、难以将其定性或是无法完整表示的信息有很好的执行能力。
(五)遗传算法
其最开始的想法是在 1975 年由 John Holland 提出。是一种新颖的、最优的
空间搜寻方法,其存有“适者生存”的观点。在整个实施环节中,发挥出其较强
的检索能力将挖掘工作转化为搜索问题,并找寻出想要的结果。
(六)可视化技术
其在数据挖掘过程中起着十分关键的作用,使一直沿用的图表功能得以很好
的延伸,对操作后产生的效果也起到了一定的提升作用,并将得到的知识以人们
可以接受,且容易被理解的方式展现出来,得到使用者的认可。
·102·

