Page 113 - 新时期档案管理理论与实践探析
P. 113
第四章 大数据在档案管理中的应用
这些潜在有价值的知识是隐藏的、不被人所了解的。
总的来说,数据挖掘不是一门独立的学科,是汇集了多种学科交叉的技术手
段,是信息技术自然演化的结果。其通过对数据源进行深层次的解读,从中按需
挖掘出人们需要的知识及潜在的规律。通过发现及运用可以为不同行业的发展提
供各种保障支持。
下面将数据挖掘技术参照不同的标准分类如下。
(一)数据类型
因为数据库分类标准各不相同,因此可按如下进行划分。
数据模型:面向对象、关系的或数据仓库的数据挖掘系统。
特定类型:时间的、空间的、文本的、多媒体的数据挖掘系统。
(二)知识类型
包括关联、特征化、分类、区分、聚类、演变分析、偏差分析或预测等。
(三)选用技术
有面向数据库技术、机器学习、统计学、可视化、模式识别、神经网络、遗
传算法、决策等描述。
(四)根据应用
因数据挖掘系统的本身不可能适用于所有领域,因此就需要调整系统的运行
方式。使其适用于当前的研究范畴,最终达成既定的目标。
三、数据挖掘的实施步骤
将数据挖掘技术应用到商业中。在帮助商业提升产品质量,辅助增强其软实
力的同时达成提升市场竞争实力的目的。随着人们对数据挖掘技术研究的逐渐深
入,将其步骤总结如下。
(一)确立分析目标
对任务进行分析,通过了解其相关知识,业务范围后,将不同的数据加以收
集、整理,锁定目标后,运用数据挖掘技术完成相应的处理工作。
(二)获取分析变量
完成上一步操作之后,在确保数据信息具有相对完整、层次等特质基础上,
·99·

