Pearson系数、Spearman系数、Kendall系数使用条件

数据小兵
数据小兵
数据小兵
64
文章
0
评论
2020-04-1709:05:00 评论 4,905 564字
摘要

相关系数是用来研究变量之间相关程度的统计量,它有许多种形式,是一个大家族,其中使用最为普遍的当属Pearson系数、Spearman系数、Kendall系数。

使用SPSS双变量相关分析菜单即可以计算得到这三个系数。

Pearson系数、Spearman系数、Kendall系数使用条件

一.Pearson系数使用条件

适用于服从正态分布的两连续型变量,可绘制散点图,发现有线性趋势之后,进而计算Pearson相关系数,以此描述两变量的线性相关性;

要求两变量为定距变量,两个变量的观测是成对的,且不能有极值。

二.Spearman系数使用条件

Spearman等级相关系数对数据条件的要求没有Pearson相关系数严格,适用于两定序变量相关分析。

同时,当两定距变量不满足正态分布等假设条件时,可使用Spearman系数;

三.Kendall系数使用条件

Kendall系数具体有3种,Kendall"s tau_a,Kendall"s tau_b,Kendall"s tau_c,tau_a不常用,SPSS统计软件主要提供Kendall"s tau_b。

适用于两定序变量相关分析,当两定距变量不满足正态分布条件,此时也可使用Kendall"s tau_b系数。使用条件和Spearman系数类似,相对而言Spearman系数的更常用一些。

四.小结

当数据资料不满足双变量正态分布或总体分布未知,或数据资料为定序(有序分类变量)时,适用于Spearman或kendall相关系数。否则宜用Pearson相关系数。

End.作者:数据小兵来源:博客本文均已和作者授权,如转载请与作者联系。

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: