Page 139 - 水文预报与水资源优化管理技术
P. 139
水文预报与水资源优化管理技术
y = a + b×x 2
在这种回归技术中,最佳拟合线不是直线。而是一个用于拟合数据点的
曲线。
(四)Stepwise Regression 逐步回归
在处理多个自变量时,我们可以使用这种形式的回归。在这种技术中,自变
量的选择是在一个自动的过程中完成的,其中包括非人为操作。
这一壮举是通过观察统计的值,如 R-square,t-stats 和 AIC 指标,来识别重
要的变量。逐步回归通过同时添加 / 删除基于指定标准的协变量来拟合模型。下
面列出了一些最常用的逐步回归方法:
标准逐步回归法做两件事情。即增加和删除每个步骤所需的预测。
向前选择法从模型中最显著的预测开始,然后为每一步添加变量。
向后剔除法与模型的所有预测同时开始,然后在每一步消除最小显著性的
变量。
这种建模技术的目的是使用最少的预测变量数来最大化预测能力。这也是处
理高维数据集的方法之一。
(五)Ridge Regression 岭回归
岭回归分析是一种用于存在多重共线性(自变量高度相关)数据的技术。在
多重共线性情况下,尽管最小二乘法(OLS)对每个变量很公平,但它们的差异
很大,使得观测值偏移并远离真实值。岭回归通过给回归估计上增加一个偏差
度,来降低标准误差。
(六)Lasso Regression 套索回归
它类似于岭回归,Lasso(Least Absolute Shrinkage and Selection Operator)也
会惩罚回归系数的绝对值大小。此外,它能够减少变化程度并提高线性回归模型
的精度。看看下面的公式:
(七)ElasticNet 回归
ElasticNet 是 Lasso 和 Ridge 回归技术的混合体。它使用 L1 来训练并且 L2 优
132

