Page 136 - 智慧园区物联网平台应用与行业分析
P. 136
智慧园区物联网平台应用与行业分析
Smart Park IoT Platform Application and Industry Analysis
习方面发挥了显著作用。
3. 决策树方法
信息论方法(决策树)是利用信息论的原理建立决策树。由于该方法最后获得的
知识表示形式是决策树,因此一般称它为决策树方法。这类方法的实用效果好,所以
影响较大。比较典型的方法有:
(1)ID3 等方法
ID3 方法是利用信息论中互信息建立决策树寻找数据库中具有最大信息量的字段,
建立决策树的一个节点,再根据字段的不同取值建立树的分支,再由每个分支的数据
子集重复建立树的下层节点和分支的过程,这样就建立了决策树。这种方法对数据库
越大效果越好。ID3方法在国际上影响较大,后来还陆续开发了1D4、1D5、C4.5等方法。
(2)IBLE 方法
IBLE 方法是利用信息论中的信道容量,寻找数据库中信息量从大到小的多个字
段的取值建立决策规则树的一个节点,并根据该节点中指定字段取值的权值之和与两
个阈值比较,建立左、中、右三个分支,在各分支子集中重复建立树节点和分支的过程。
4. 集合论方法
集合论方法是开展较早的一种方法。近年来,由于粗集理论的发展使集合论方法
得到了迅速的发展。这类方法中包括:覆盖正例排斥反例的方法、概念树方法和粗集
(Rough Set)方法。
(1)覆盖正例排斥反例的方法
覆盖正例排斥反例的方法是利用覆盖所有正例,排斥所有反例的思想来寻找规则。
比较典型的有 AQ11 方法等。
AQ 系列方法的核心算法是在正例集中任选一个种子,它到反例集中逐个比较,
对字段取值构成的选择子兼容则舍去,相斥则保留。按此思想循环所有正例种子,将
得到正例集的规则(选择子的合取式)。
(2)概念树方法
数据库中记录的属性字段按归类方式进行合并,建立起来的层次结构称为概念树。
利用概念树提成的方法可以大大浓缩数据库中的记录。例如对“园区”概念树的最下
层是具体企业名,它的直接上层是所在地市名。对多个属性字段的概念树提升,将得
到高度概括的知识基表,再将它转换成规则。
(3)粗集方法
在数据库中将行元素看成对象,列算数看成属性(分为条件属性和决策属性)。
等价关系 R 定义为不同对象在某一个(或多个)属性上取值相同,这些满足等价关系
的对象组成的集合称为该等价关系 R 的等价类。条件属性上的等价类 E 与决策属性上
124

