SPSS教程学习笔记6:数据随机化游程检验

数据小兵
数据小兵
数据小兵
64
文章
0
评论
2020-04-1803:05:00 评论 1,723 1257字
摘要

游程检验亦称”连贯检验”,主要目的就是检验取值为二分类并且按某种顺序(例如时间顺序)排列的数据资料,是否确实是随机出现的,可以通俗理解为检验样本数据的随机性。

这个方法对于提前了解数据质量,在数据预处理阶段能发挥比较重要的作用,但在实际应用当中,它反而是太低调,以至于很多人压根不知道还有这么一个统计方法。

一.基本原理

简单举例说明:比如一组数据00110111000100100010,共20位。前两个0连贯出现1次,称为1个游程,第3和4位连贯两个1出现1次,称为1个游程,第5位单独一个0也算1个游程,第6第7第8位,三个1连贯出现,算作一次游程,依次类推,这组数据00110111000100100010,(0用划线,1不用划线)就有11个游程。这是游程的概念。 原则:如果序列为真随机序列,那么游程的总数应该不太多也不太少。如果游程的总数极少,就说明样本缺乏独立性,内部存在一定的趋势或者结构,这可能由于观察值间不独立,或者来自不同的总体。如果样本间存在大量游程,则可能有系统的短周期波动影响观察结果,同样认为序列非随机。 检验原理:将数据分为两类(以平均数或者中数或者众数或者自定义的值为基准,小于此基准的为一类,大于此基准的为一类),看前一个个案的是否影响后一个个案的,若不影响,进而得到数据是随机抽取的。 假设检验中原假设H0:样本是随机抽取的。

二.案例演示

收集生产线上连贯生产的30袋食品并称重,试分析该生产线运行是否正常。

SPSS教程学习笔记6:数据随机化游程检验

如上图,数据包括编号和重量两个变量。

1.调出菜单界面

菜单栏中选择【分析】→【非参数检验】→【单样本】。

SPSS教程学习笔记6:数据随机化游程检验

2.参数设置

【单样本非参数检验】有三个选项卡,第一个选项卡【目标】选择【定制分析】,第二个选项卡【字段】,将左侧变量栏中的"重量"移入右侧【检验字段】栏中,第三个选项卡【设置】,第一项【选择检验】,在【定制检验】界面中选择最后一项【检验序列的随机性(游程检验)】,点击【选项】按钮,在【定义连续字段的分割点】下选择【样本平均数】。其他选项不用过多设置,默认采用0.05临界显著性水平。

SPSS教程学习笔记6:数据随机化游程检验

将连续变量分隔为二分类,除了我们前面提到的平均值外,选择数据均值作为分隔点,同样是非常棒的参考标准。

3.执行任务

点击下方【运行】,SPSS软件开始执行此次游程检验。

4.结果分析

SPSS单样本游程检验,假设检验摘要表。

SPSS教程学习笔记6:数据随机化游程检验

30袋食品重量的均值为83.57,以83.57作为分隔点,将30个数据分割为两组,原假设第一组内的重量值和第二组内的重量值是随机序列,游程检验给出的显著性是0.00,小于临界值0.05,拒绝随机性假设,说明该生产线生产情况不正常,生产过程中连续出现重量偏低或者偏高的产品。

SPSS教程学习笔记6:数据随机化游程检验

双击假设检验表,还可以打开具体的数据,如上,此组数据共出现5个游程,属于偏少的情况,数据本身并不具备完全的随机化,对于产品生产来说,可能过多的出现连续偏高或偏低的产品。

SPSS教程学习笔记6:数据随机化游程检验

再制作一个条形图,我们也可以从图形能看出游程的分布情况,产品生产连续偏高和偏低,随机化较差。

三.练习所需数据下载

链接: https://pan.baidu.com/s/1A3n6Q7eFkcV3_9zUhoYIBA 密码: wkut

End.作者:数据小兵来源:博客本文均已和作者授权,如转载请与作者联系。

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: