Page 135 - 智慧园区物联网平台应用与行业分析
P. 135
» 第二章 智慧园区的技术实现
4. 预测
预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及
特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。
5. 时序模式
时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它
也是用已知数据预测未来的数据值,但这些数据的区别是变量所处时间的不同。
6. 偏差分析
在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库
中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照
之间的差别。
(三)数据挖掘的主要算法
数据挖掘方法是由人工智能、机器学习的方法发展而来,并结合传统的统计分析
方法、模糊数学方法以及科学计算可视化技术 . 以数据库为研究对象,形成了数据挖
掘的方法和技术。数据挖掘技术和方法可以分为以下几大类。
1. 神经网络算法
神经网络算法是模拟了人脑神经元接口,以 MP 模型和 Hebb 学习规则为基础的,
建立了三大类多种神经网络模型:
①前馈式网络:它是以感知机、BP 反向传播模型、函数型网络为代表,此类网
络可用于预测、模式识别等方面。
②反馈式网络:它以 Hopfield 的离散模型和连续模型为代表,分别用于联想记忆
和优化计算。
③自组织网络:它以 ART 模型、Kohonen 模型为代表,它们用于聚类。
神经网络的知识体现在网络结构和全职上,是一个分布式矩阵结构。神经网络的
学习体现在神经网络权值的逐步计算上(包括反复迭代或者累加计算)。
2. 遗传算法
这是模拟生物进化过程的算法,它由三个基本算子组成:
①繁殖(选择):从一个旧种群(父代)选择出生命力强的个体,产生新种群(后
代)的过程。
②交叉(重组):选择两个不同个体(染色体)的部分(基因)进行交换,形成
新个体。
③变异(突变):对某些个体的某些基因进行变异(0 变 1 或者 1 变 0)。
这种遗传算法起到产生优良后代的作用。这些后代需要满足适应值,经过若干代
的遗传,将得到满足要求的后代(问题解)。遗传算法已经在优化计算和分类机器学
123

