Page 170 - 计算机应用软件开发技术研究
P. 170
计算机应用软件开发技术研究
Research on Computer Application Software Development Technology
第二,贝叶斯分类。贝叶斯分类是统计学分类方法,它可以预测类成员关系
的可能性。我们假定一个属性值对给定类的影响独立于其他属性的值,由于这一
假定,我们称这种分类方法为朴素贝叶斯分类。
第三,贝叶斯信念网络法。朴素贝叶斯分类法需要假定属性值对给定类的影
响独立于其他属性的值,但实际情况并不总是如此。贝叶斯信念网络说明联合条
件概率分布,它允许在变量的子集间定义类条件独立性。它提供一种因果关系的
图形,可以在其上进行学习。
第四,神经网络学习算法。神经网络的优点是对噪声数据的承受能力高,对
未经训练的数据分类模式的适应能力强。缺点是训练时间长,网络拓扑的确定主
要靠经验,解释性差。
第五,K-最邻近分类。最邻近分类基于类比学习,给定一个未知样本,K-
最邻近方法搜索模式空间,找出最接近未知样本的 k 个训练样本,这 k 个训练样
本的类别就决定了这个未知样本的类别。
第六,基于案例的推理。基于案例的推理分类法是基于要求的。当给定一个
待分类的新案例时,基于案例的推理首先检查是否存在一个同样的训练案例,找
到就返回该案例的解,找不到将搜索具有类似于新案例成分的训练案例。基于案
例的推理存在的一个问题是如何找到一个好的相似性度量。
第七,遗传算法。遗传算法采用自然界的进化思想。遗传算法的难点是参数
和策略的选择,如变异概率、交叉策略等。遗传算法的优点是易于并行,且在其
他优化问题上已有很多经验。
第八,粗糙集方法。粗糙集方法基于给定训练数据内部的等价类的建立。现
实世界数据中,通常有些类不可能被可用的属性区分,粗糙集可以用来近似或粗
略地定义这种类。
第九,模糊集方法。基于规则的分类方法都有一个缺点:对于连续属性,它
们不可避免地有陡峭的截断。而模糊逻辑使用 0~1 的某个值表示一个特定的值是
一个给定类成员的程度,不是用类或集合的精确截断。
·158·

