Page 139 - 水文预报与水资源优化管理技术
P. 139

水文预报与水资源优化管理技术



                                           y = a + b×x 2

               在这种回归技术中,最佳拟合线不是直线。而是一个用于拟合数据点的

           曲线。
              (四)Stepwise Regression 逐步回归

               在处理多个自变量时,我们可以使用这种形式的回归。在这种技术中,自变
           量的选择是在一个自动的过程中完成的,其中包括非人为操作。

               这一壮举是通过观察统计的值,如 R-square,t-stats 和 AIC 指标,来识别重
           要的变量。逐步回归通过同时添加 / 删除基于指定标准的协变量来拟合模型。下

           面列出了一些最常用的逐步回归方法:
               标准逐步回归法做两件事情。即增加和删除每个步骤所需的预测。

               向前选择法从模型中最显著的预测开始,然后为每一步添加变量。
               向后剔除法与模型的所有预测同时开始,然后在每一步消除最小显著性的

           变量。
               这种建模技术的目的是使用最少的预测变量数来最大化预测能力。这也是处

           理高维数据集的方法之一。
              (五)Ridge Regression 岭回归

               岭回归分析是一种用于存在多重共线性(自变量高度相关)数据的技术。在
           多重共线性情况下,尽管最小二乘法(OLS)对每个变量很公平,但它们的差异

           很大,使得观测值偏移并远离真实值。岭回归通过给回归估计上增加一个偏差

           度,来降低标准误差。
              (六)Lasso Regression 套索回归

               它类似于岭回归,Lasso(Least Absolute Shrinkage and Selection Operator)也
           会惩罚回归系数的绝对值大小。此外,它能够减少变化程度并提高线性回归模型

           的精度。看看下面的公式:
              (七)ElasticNet 回归

               ElasticNet 是 Lasso 和 Ridge 回归技术的混合体。它使用 L1 来训练并且 L2 优


           132
   134   135   136   137   138   139   140   141   142   143   144