均值与期望到底是不是一回事?

张俊红
张俊红
张俊红
54
文章
0
评论
2021-04-2120:05:42 评论 2,176 1300字
摘要

均值和期望的本质上的区别是前者是是一个具体的、实际的值,而后者是通过概率得出来的值;两者在一般情况计算出来的值都是一样的,这也就是为什么会有把期望理解成均值的做法。

均值和期望是我们平常接触比较多的两个概念,均值大家都知道,就是若干个值先求和,然后再除值的个数;那期望又是什么。一般人们为了便于理解,就会说,你把期望也理解成是均值就可以了。那到底可不可以这样呢,我们这一篇来具体看看。

先来看看期望这个概念的历史:

早在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目,题目是这样的:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平?用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)(1/2)=3/4,或者分析乙获胜的概率为(1/2)(1/2)=1/4。因此由此引出了甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。这个故事里出现了"期望"这个词,数学期望由此而来。

通过上面的故事我们可以看出,期望是一种通过概率计算出来的值,是理想状态下我们希望得到的结果。不常有一句话叫做,期望越大失望越大么,这里面的期望其实就和我们这里提到的期望差不多。

我们再来看一下期望的数学定义是怎么定义的,期望一般用E(X)来表示。

E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn)

X1,X2,X3,……,Xn表示具体的n个值,p(X1),p(X2),p(X3),……,p(Xn)为这几个值对应的出现的概率。在已知的一份数据集中,概率值p(X1),p(X2),p(X3),……,p(Xn)可以理解为值X1,X2,X3,……,Xn出现的频率f(Xi),则:

E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn)      = X1*f1(X1) + X2*f2(X2) + …… + Xn*fn(Xn)

某个值出现的频率=该值出现的次数/所有值出现的次数之和。

现在有下面这么几个值,我们来分别计算一下这些值的均值和期望。

1,1,2,5,2,6,5,8,9,4,8,1

均值 = (1+1+2+5+2+6+5+8+9+4+8+1)/12 = 13/3

每个值出现的频率为:

频率
1 f(1)=3/12
2 f(2)=2/12
4 f(4)=1/12
5 f(5)=2/12
6 f(6)=1/12
8 f(8)=2/12
9 f(9)=1/12
期望 = 1*f(1)+2*f(2)+4*f(4)+5*f(5)+6*f(6)+8*f(8)+9*f(9) = 13/3

我们可以看到计算出来的两个值是相等的,这是巧合吗?不是的,在已知的一份数据集中,这两个值计算出来都是相等的。

均值和期望的本质上的区别是前者是是一个具体的、实际的值,而后者是通过概率得出来的值;两者在一般情况计算出来的值都是一样的,这也就是为什么会有把期望理解成均值的做法。

End.

爱数据网专栏作者:张俊红

作者介绍:一个数据科学路上的学习者、实践者、传播者

个人公众号:俊红的数据分析之路

本文为挖数网专栏作者原创文章,未经允许禁止转载,需要转载请微信联系授权(微信号:lovedata0520)

更多文章前往爱数据社区网站首页浏览http://www.itongji.cn/

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: