Page 117 - 新能源风力发电技术及其发展研究
P. 117

Research on New Energy Wind Power Generation Technology and Development
             新能源风力发电技术及其发展研究


                  优势:充分利用有限的数据资源,减少因样本差异导致的评估失真;同时提
             供了更稳定的性能估计。
                  应用:适用于大多数机器学习算法的初步评估阶段,特别是当数据量相对较

             小或难以获得独立测试集时。
                  2. 留一法(Leave-One-Out Cross Validation, LOOCV)
                  原理:当样本数量较少时,可采用 LOOCV 方法,即每次只留一个样本作为
             验证集,其余全部用作训练集。

                  特点:几乎利用了所有可用数据,理论上能得到最无偏的性能估计;但由于
             计算成本极高,通常仅限于小规模数据集。
                  3. 时间序列分割(Time Series Split)
                  原理:考虑到风力发电设备运行数据的时间序列特性,不能简单地随机打乱

             顺序。因此,应当按照时间先后顺序划分训练集和测试集,保证测试集始终位于
             训练集之后。
                  应用:非常适合用于预测未来时间段内的故障风险或功率输出等任务,避免
             引入未来信息造成泄露。

                  4. 独立测试集
                  原则:除了交叉验证外,还应保留一部分未参与训练的数据作为最终的测试
             集,用来检验模型的真实泛化能力。
                  要求:确保测试集足够大且具有代表性,避免因样本差异导致评估失真;同

             时要严格保密,防止任何形式的信息泄露。
                 (九)模型调优与超参数调整
                  模型的性能不仅取决于算法本身,还受到许多超参数的影响。合理的超参数
             设置可以显著提升模型的表现。以下是几种常用的调优方法。

                  1. 网格搜索(Grid Search)
                  原理:穷举所有可能的超参数组合,找到最优解。
                  局限性:尽管简单直接,但对于高维空间效率低下,尤其是当参数范围较大
             时,计算成本极高。

                  应用:适用于超参数空间较小且计算资源充足的场景;可以通过并行计算加
             速过程。





             104
   112   113   114   115   116   117   118   119   120   121   122