Page 134 - 智慧园区物联网平台应用与行业分析
P. 134
智慧园区物联网平台应用与行业分析
Smart Park IoT Platform Application and Industry Analysis
异群组分析和演变分析等手段,挖掘数据的潜在价值的过程。
图 2-25 知识发现过程
(二)数据挖掘主要分析任务
在智慧园区的建设中,数据挖掘的任务主要是关联分析、聚类分析、分类、预测、
时序模式和偏差分析等。
1. 关联分析
关联规则挖掘是由 Rakesh Apwal 等人首先提出的。两个或两个以上变量的取值
之间存在某种规律性,称为关联。数据关联是数据库中存在的一类重要的、可被发现
的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是要找出数据库
中数据之间隐藏的关联关系。一般用支持度和可信度两个阈值来度量关联规则的相关
性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需要。
2. 聚类分析
聚类分析是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同
类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的
数据属性之间的相互关系。
3. 分类
分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内
涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练
数据集通过一定的算法而求分类规则。分类可被用于规则描述和预测。
122

