Page 113 - 新时期档案管理理论与实践探析
P. 113

第四章  大数据在档案管理中的应用




             这些潜在有价值的知识是隐藏的、不被人所了解的。
                 总的来说,数据挖掘不是一门独立的学科,是汇集了多种学科交叉的技术手

             段,是信息技术自然演化的结果。其通过对数据源进行深层次的解读,从中按需
             挖掘出人们需要的知识及潜在的规律。通过发现及运用可以为不同行业的发展提

             供各种保障支持。
                 下面将数据挖掘技术参照不同的标准分类如下。
                 (一)数据类型

                 因为数据库分类标准各不相同,因此可按如下进行划分。
                 数据模型:面向对象、关系的或数据仓库的数据挖掘系统。

                 特定类型:时间的、空间的、文本的、多媒体的数据挖掘系统。
                 (二)知识类型
                 包括关联、特征化、分类、区分、聚类、演变分析、偏差分析或预测等。

                 (三)选用技术
                 有面向数据库技术、机器学习、统计学、可视化、模式识别、神经网络、遗

             传算法、决策等描述。
                 (四)根据应用

                 因数据挖掘系统的本身不可能适用于所有领域,因此就需要调整系统的运行
             方式。使其适用于当前的研究范畴,最终达成既定的目标。


                 三、数据挖掘的实施步骤

                 将数据挖掘技术应用到商业中。在帮助商业提升产品质量,辅助增强其软实

             力的同时达成提升市场竞争实力的目的。随着人们对数据挖掘技术研究的逐渐深
             入,将其步骤总结如下。

                 (一)确立分析目标
                 对任务进行分析,通过了解其相关知识,业务范围后,将不同的数据加以收
             集、整理,锁定目标后,运用数据挖掘技术完成相应的处理工作。

                 (二)获取分析变量
                 完成上一步操作之后,在确保数据信息具有相对完整、层次等特质基础上,



                                                                                  ·99·
   108   109   110   111   112   113   114   115   116   117   118