一.数据集
收集淘宝网自2003年到2012年的淘宝交易额、淘宝注册人数的数据,以及我国网络普及度等数据并从国家统计年鉴中选取统计指标居民消费水平数据,以淘宝网交易额为目标,研究淘宝网未来发展走势。
二.相关性
针对数据集,进行复相关系数的研究,看变量之间的复相关关系,得到如下的复相关系数表。
对变量进行散点图的分析来了解自变量与因变量的相关关系,如下:
可以看出自变量x2和因变量y之间呈明显的指数线性关系,而变量x4也是同样与因变量y之间呈明显的指数线性关系,他们之间是非线性回归模型的关系。而x1和x4与y的关系主要体现为线性相关。
三.线性转换
非线性问题,我们一般是先转换为线性,然后建模。这篇文章认为x2和x4与y均呈现指数关系,所以需要对这两个变量进行指数函数变换,然后重新线性建模。
四.多重线性回归
End.作者:数据小兵来源:博客本文均已和作者授权,如转载请与作者联系。
- 我的微信公众号
- 微信扫一扫
- 我的微信公众号
- 微信扫一扫
评论