Page 133 - 智慧园区物联网平台应用与行业分析
P. 133
» 第二章 智慧园区的技术实现
三、数据挖掘应用
在智慧园区的运营过程中,数据挖掘技术是处理感知层数据的必要手段。在智慧
园区通过感知层对现实世界进行感知、识别和信息采集的基础功能,必然产生海量的
感知数据。而对于海量数据的处理不是简单的存储与查询统计,必须通过智能化的分
析与挖掘方法充分挖掘数据的潜在信息和应用价值,从而使园区的管理决策从经验式
决策向科学化决策转变。
通过数据挖掘技术的应用,可以为智慧园区的各个领域提供强大的决策支持。数
据挖掘技术是构建智慧园区的信息引擎,是将园区推向智慧化的主要手段。在本章,
我们将重点介绍数据挖掘技术的应用方式和主要手段。
(一)数据挖掘概念
数据挖掘就是从大量数据中提取或“挖掘”知识的过程。还有一些术语,具有和
数据挖掘类似,但稍有不同的含义,如数据库中知识挖掘、知识提取、数据 / 模式分析、
数据考古和数据捕捞等。
数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in
Database,KDD),是目前人工智能和数据库领域研究的热点问题。所谓数据挖掘是
指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值信息的过程。数据
挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数
据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘
出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
我们认为数据挖掘是知识发现过程中的一个步骤。我们采用数据挖掘的广义观点:
数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据挖掘有价值知识的
过程。
完整的知识发现过程,总体上可以分为三个阶段组成:数据准备、数据挖掘、结
果表达和解释。具体的知识发现过程如图 2-25 所示。
①数据清理:消除噪音或不一致数据。
②数据集成:多种数据源可以组合在一起。
③数据选择:从数据库中提取与分析任务相关的数据。
④数据变换:数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作。
⑤数据挖掘:是知识发现的主要步骤,使用智能方法提取数据模式。
⑥模式评估:根据某种兴趣度度量,识别提供知识的真正有趣的模式。
⑦知识表示:使用可视化和知识表示技术,向用户提供挖掘的知识。
其中数据挖掘的主要任务是通过关联分析、聚类分析、分类分析、异常分析、特
121

