Page 160 - 计算机应用软件开发技术研究
P. 160
计算机应用软件开发技术研究
Research on Computer Application Software Development Technology
6.演变分析
数据演变分析描述行为随时间变化的对象的规律或趋势,并对其建模。它包
括时间序列数据分析、序列或周期模式匹配和基于类似性的数据分析。
(五)数据挖掘模式
数据挖掘发现的知识模式有多种不同的类型,常见的模式有:分类模式、聚
类模式、关联模式、序列模式等。
1.分类模式
分类模式是反映同类事物间的共性以及异类事物间的差异的特征知识。它可
以提取数据类的特征模型,进而预测事物发展的趋势。分类模式往往表现为一棵
分类树,从树根开始搜索,沿着满足条件的分支走,走到树叶就能确定类别。已
经有许多数据分类的方法,如判定树、统计方法、神经网络等。其中判定树方法
由于具有速度快、精度高、生成模式简单等优点而广泛应用。
2.聚类模式
聚类模式与分类模式不同,它在事先不知道分组及如何分组的情况下,根据
一定的基本规则,把数据划分到不同的组中,组之间的差别应尽可能大,而组内
的差别则应尽可能小。聚类模式的挖掘可以采用统计方法、机器学习方法等。
3.关联模式
关联模式也称为关联规则,是数据挖掘的一个重要课题。关联规则广泛应用
于购物篮或者事务数据的分析当中。例如,在无力偿还贷款的人当中,60% 的人
的月收入在 3000 元以下。
4.序列模式
序列模式与关联模式相仿,而把数据之间的关联性与时间联系起来。序列模
式不仅需要考虑事件是否发生,而且需要考虑事件发生的时间因素。例如,在购
买彩电的人们当中,60% 的人会在 3 个月内购买影碟机。
(六)挖掘的实施步骤
数据挖掘的实施包括:问题的理解和提出、数据准备、数据整理、建立模型
及评价和解释等步骤。
1.问题的理解和提出
在开始数据挖掘之前最基础的就是理解数据和实际的业务问题,在这一基础
上提出问题,对目标有明确的定义。本课题选择了两部分数据进行了分析和问题
·148·

