Page 83 - 城镇燃气管道检测与评估技术规程
P. 83
第二章 管道智能检测研究
数据的分布。由于考虑了特征的协方差模型,GMM 算法可以提供更强的描述能
力。相比于 K 均值算法,GMM 算法有更多的初始条件需要设置,所需设置参数
包括初始类中心、协方差矩阵和混合权重。
(5)凝聚层次聚类(Agglomerative Hierarchical Clustering,AHC)
AHC 是一种自底向上的方法,其中每个数据点从它们自己的集群开始,并
在一个集群向上移动时依次合并在一起创建新的集群,一个链接标准决定了哪些
数据集合会被分配到一组。这些集群的层次可以用树状图表示。
以上广泛使用的算法实际上可依据各自的基本原理分为三类,即基于距离、
基于模型和基于密度的聚类。其中,基于密度的聚类具备对不规则形状集合进行
大规模高效处理的能力,无需提前假设类别个数以及其他参数等,因此近年来密
度聚类是一个研究热点。
1996 年,EsterMartin 等人提出了 DBSCAN 算法,该算法可以对大规模数
据集进行聚类,有效提高了聚类速度。1998 年,Hinneburg 等人开发了基于核
密度原理的 DENCLUE 聚类,提高了计算局部密度速度。同年 Sander 等人提出
的 GDBSCAN 算法泛化了基于密度簇类的拓扑结构。1999 年,Ankerst 等人提
出 OPTICS 算法,消除了对于距离阈值参数的近似值选择需求,产生了一种与连
接聚类类似的层级聚类结果。2007 年,Birant 提出了 ST-DBSCAN 算法,可以
根据目标的非空间值、空间值和时间值进行聚类。2010 年,Kisilevich 等人提出
P-DBSCAN 算法,用于分析使用地理标签的照片集合。2013 年,HDBSCAN 由
Campello 等人提出,将密度算法转变成层次聚类的方式进行扩展。
2014 年,Rodriguez 等人提出快速搜索密度峰值聚类算法。该算法是一种可
以发现非凸簇类的新型聚类算法,无需指定聚类数量,与其他方法不同之处在于
该方法无需迭代,计算速度更快,参数条件容易。因此为诸多难题带来了全新的
解决方式,算法应用潜力巨大。
3. 有监督智能诊断方法研究
提取的管道缺陷信号特征能够清晰地反映有效信息,利用有监督智能诊断算
法可以准确地分析出此特征隐含的管道缺陷状态,识别缺陷类型进而给出正确的
应对方案。监督学习是用基于有标签的学习来描述预测任务的方法,目标是预测
或者进行一个特定的分类。预测分类结果的监督学习在机器学习中通常称为分类,
而预测连续结果称为回归,即二者区别在于输出变量的类型,连续变量的预测属
75

