Page 133 - 智慧园区物联网平台应用与行业分析
P. 133

» 第二章  智慧园区的技术实现




                   三、数据挖掘应用

                   在智慧园区的运营过程中,数据挖掘技术是处理感知层数据的必要手段。在智慧
               园区通过感知层对现实世界进行感知、识别和信息采集的基础功能,必然产生海量的

               感知数据。而对于海量数据的处理不是简单的存储与查询统计,必须通过智能化的分
               析与挖掘方法充分挖掘数据的潜在信息和应用价值,从而使园区的管理决策从经验式
               决策向科学化决策转变。
                   通过数据挖掘技术的应用,可以为智慧园区的各个领域提供强大的决策支持。数

               据挖掘技术是构建智慧园区的信息引擎,是将园区推向智慧化的主要手段。在本章,
               我们将重点介绍数据挖掘技术的应用方式和主要手段。
                   (一)数据挖掘概念

                   数据挖掘就是从大量数据中提取或“挖掘”知识的过程。还有一些术语,具有和
               数据挖掘类似,但稍有不同的含义,如数据库中知识挖掘、知识提取、数据 / 模式分析、
               数据考古和数据捕捞等。
                   数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in

               Database,KDD),是目前人工智能和数据库领域研究的热点问题。所谓数据挖掘是
               指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值信息的过程。数据
               挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数

               据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘
               出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
                   我们认为数据挖掘是知识发现过程中的一个步骤。我们采用数据挖掘的广义观点:

               数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据挖掘有价值知识的
               过程。
                   完整的知识发现过程,总体上可以分为三个阶段组成:数据准备、数据挖掘、结

               果表达和解释。具体的知识发现过程如图 2-25 所示。
                   ①数据清理:消除噪音或不一致数据。
                   ②数据集成:多种数据源可以组合在一起。
                   ③数据选择:从数据库中提取与分析任务相关的数据。

                   ④数据变换:数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作。
                   ⑤数据挖掘:是知识发现的主要步骤,使用智能方法提取数据模式。
                   ⑥模式评估:根据某种兴趣度度量,识别提供知识的真正有趣的模式。

                   ⑦知识表示:使用可视化和知识表示技术,向用户提供挖掘的知识。
                   其中数据挖掘的主要任务是通过关联分析、聚类分析、分类分析、异常分析、特


                                                                                           121
   128   129   130   131   132   133   134   135   136   137   138