统计学回归分析方法应用中的常见问题

数据小兵
数据小兵
数据小兵
64
文章
0
评论
2020-04-1709:05:00 评论 1,052 867字
摘要

1.线性回归中的奇异值、影响点和共线性问题2.线性回归应用最多,至多到多元线性回归

1.线性回归中的奇异值、影响点和共线性问题

(1)很多论文作者是将取得的数据不加分析地放在一起,进行线性回归。很少或没有注意少数奇异值(标准化残差过大,例如大于3)或影响点(标准化残差可能不很大,但对方程影响较大的点)对回归方程影响,可以反复进行回归计算来确定这些点的影响。确定是否要在回归分析时剔除这些比较特殊的点。

统计分析软件SAS和SPSS中的多元线性回归分析都有检测判断影响点和确定影响程度的方法。

(2)许多文章中的多元线性回归方程,往往是将与因变量线性相关的变量均作为回归自变量放在方程中,求出回归方程就认为可以进行预测或根据自变量值求因变量的值了。往往没有考虑到,回归分析要求回归方程中的自变量相互独立,和回归分析还应该分析评价各自变量对因变量的贡献率。

如果回归方程中的自变量彼此存在相关关系,即存在共线性现象,就会给贡献率的评价带来困难。而SAS、SPSS软件都能进行共线性诊断,并能在逐步回归的每一步显示诊断指标。

2.线性回归应用最多,至多到多元线性回归

以至于有些比较陈旧的教科书至今还只介绍二元线性回归。无论自变量与因变量之间是否存在线性关系,甚至不管变量类型,都使用线性回归去探讨预测问题。因而得不出理想的分析结果,甚至错误的结果导致错误的结论。

有了计算机和统计分析软件,以下问题会很容易解决:

(1)在回归自变量量中,某个变量与因变量间是非线性关系,但是这个关系可以用一个明确的表达式表示的,那么可以利用变量代换的方法,将代换变量作为线性回归的自变量求得线性回归方程,然后,再将原来得变量代换回去。

(2)非线性回归、曲线回归在计算机普及得今天都是很容易解决得问题。在统计分析软件中都有成熟得分析过程。例如在SPSS中Regression中的曲线估计、非线性回归。

(3)二分变量或多个分组的分类变量可以作为因变量参与回归分析,这就是近些年来在国内得到普遍应用的逻辑斯特一回归。

回归分析是发展的比较成熟的统计分析方法 , 比较广泛地应用 各领的测工作中。

End.作者:数据小兵来源:博客本文均已和作者授权,如转载请与作者联系。

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: