1.线性回归中的奇异值、影响点和共线性问题
(1)很多论文作者是将取得的数据不加分析地放在一起,进行线性回归。很少或没有注意少数奇异值(标准化残差过大,例如大于3)或影响点(标准化残差可能不很大,但对方程影响较大的点)对回归方程影响,可以反复进行回归计算来确定这些点的影响。确定是否要在回归分析时剔除这些比较特殊的点。
统计分析软件SAS和SPSS中的多元线性回归分析都有检测判断影响点和确定影响程度的方法。
(2)许多文章中的多元线性回归方程,往往是将与因变量线性相关的变量均作为回归自变量放在方程中,求出回归方程就认为可以进行预测或根据自变量值求因变量的值了。往往没有考虑到,回归分析要求回归方程中的自变量相互独立,和回归分析还应该分析评价各自变量对因变量的贡献率。
如果回归方程中的自变量彼此存在相关关系,即存在共线性现象,就会给贡献率的评价带来困难。而SAS、SPSS软件都能进行共线性诊断,并能在逐步回归的每一步显示诊断指标。
2.线性回归应用最多,至多到多元线性回归
以至于有些比较陈旧的教科书至今还只介绍二元线性回归。无论自变量与因变量之间是否存在线性关系,甚至不管变量类型,都使用线性回归去探讨预测问题。因而得不出理想的分析结果,甚至错误的结果导致错误的结论。
有了计算机和统计分析软件,以下问题会很容易解决:
(1)在回归自变量量中,某个变量与因变量间是非线性关系,但是这个关系可以用一个明确的表达式表示的,那么可以利用变量代换的方法,将代换变量作为线性回归的自变量求得线性回归方程,然后,再将原来得变量代换回去。
(2)非线性回归、曲线回归在计算机普及得今天都是很容易解决得问题。在统计分析软件中都有成熟得分析过程。例如在SPSS中Regression中的曲线估计、非线性回归。
(3)二分变量或多个分组的分类变量可以作为因变量参与回归分析,这就是近些年来在国内得到普遍应用的逻辑斯特一回归。
回归分析是发展的比较成熟的统计分析方法 , 比较广泛地应用 各领的测工作中。
End.作者:数据小兵来源:博客本文均已和作者授权,如转载请与作者联系。
- 我的微信公众号
- 微信扫一扫
-
- 我的微信公众号
- 微信扫一扫
-
评论