Page 116 - 新能源风力发电技术及其发展研究
P. 116
第四章 风力发电设备故障检测与诊断技术
(三)精确率(Precision)、召回率(Recall)和 F1 分数(F1 Score)
定义:精确率是指预测为正类的样本中有多少是真正的正类;召回率是指所
有真实正类中有多少被正确预测出来;F1 分数则是两者的调和平均值。
应用:特别适合处理不平衡数据集中的二元分类问题。例如,在风力发电设
备中,某些故障类型发生频率较低,但一旦发生后果严重,此时应优先关注这些
罕见故障的召回率。
(四)均方误差(MSE)/ 均方根误差(RMSE)
定义:适用于回归问题,用于度量预测值与真实值之间的平均偏差大小。
应用:可用于预测风力发电机未来一段时间内的功率输出值或特定部件的温
度变化趋势。较低的 MSE 或 RMSE 意味着更好的拟合效果。
2
(五)R 得分(R-squared Score)
定义:表示模型解释了多大比例的输出变量变异,取值范围从 0 到 1,越接
近 1 说明模型越好。
应用:同样适用于回归问题,尤其当希望量化模型相对于基准线(如平均值)
的改进程度时。
(六)受试者工作特征曲线下的面积(AUC-ROC)
定义:专用于二元分类问题,反映了不同阈值下真阳性和假阳性率的变化趋
势。AUC 值越高,模型区分能力越强。
应用:在风力发电设备故障预测中,AUC-ROC 可以帮助比较不同模型的总
体性能,尤其是在存在多个候选模型的情况下。
(七)对数损失(Log Loss)
定义:衡量分类模型概率估计的质量,尤其适合处理不平衡数据集。
应用:对数损失不仅可以反映分类准确性,还能评估模型给出的概率分布是
否合理。这对于风力发电设备故障预测中涉及的风险评估至关重要。
(八)交叉验证与测试集划分
为了确保评估结果具有代表性并且不受偶然因素影响,通常采用以下几种策
略进行数据划分和验证。
1.K 折交叉验证(K-Fold Cross Validation)
原理:将数据集随机划分为 K 个子集,轮流使用其中一个作为验证集,其
余 K-1 个作为训练集。重复 K 次后取平均性能指标。
103

