100种分析思维模型(007号)

林骥
林骥
林骥
44
文章
0
评论
2021-08-2515:23:08 评论 17 2016字
摘要

你好,我是林骥。在现实世界中,你看不到一吨重的老鼠,也看不到一斤重的大象。你有没有想过这是为什么呢?今天介绍的第 007 号分析思维模型,可以很好地回答这个问题。

 

1. 模型介绍

在统计学里面,正态分布是一种很常见的模型,像人的寿命、血压、考试成绩、测量误差等等,都属于正态分布

100种分析思维模型(007号)

为什么正态分布模型很常见呢?

根据中心极限定理,如果一个事物受到多种相互独立随机因素的影响,不管每个因素本身是什么分布,最终结果都属于正态分布。

许多事物都受到多种因素的影响,所以导致正态分布很常见。

正态分布的特点,是大部分数据都离平均值很近,几乎不可能出现极端异常的值。所以在现实世界中,你看不到一吨重的老鼠,也看不到一斤重的大象

 

2. 应用举例

正态分布在生产管理中经典应用是「六西格玛方法,简写为「」,也就是对产品属性进行建模明确误差要减小到什么程度,产品合格率才算达标。这样企业就有了量化的目标,从而可以花大力气去改善产品的质量。

100种分析思维模型(007号)

假设有一家专业制造汽车配件的公司,生产一种直径为 21 毫米的螺丝,误差不能超过 1 毫米,也就是说,螺丝直径范围必须在 20-22 毫米之间,否则有可能导致安全事故,因此必须做好产品质量管理。

由于螺丝直径的误差是很多种随机因素导致的,例如金属质量的变化、机器振动、温度和速度的波动等等,所以根据中心极限定理,推断螺丝的直径应该服从正态分布。

公司不可能精确地测量每一个螺丝的直径,通常会采取随机抽样的方法,根据样本来计算平均值和标准差,假设平均值是 21 毫米,6σ 等于 1,也就是说,基准标准差等于 1/6,如果能够达到这个标准,那么生产出来的产品质量就是比较可靠的,产品合格的概率高达 99.99968%,这并不容易,需要持续改进才有可能做到。

管理的实践,并不是计算出标准差就万事大吉,而是需要做很多非常艰巨的工作,来使得实际的标准差确实降到基准值以内

我们学习分析思维模型,也不是理解了它的原理就好了,而是要把它应用到实践中,用它来解决现实中遇到的难题。

 

3. Python实践

我用 Python 模拟六个骰子,每个骰子的点数是随机的,从 1 到 6 的概率都是 1/6,如果把六个骰子的点数相加,然后画出分布图,与正态分布很接近

100种分析思维模型(007号)

从这个例子也可以看出,中心极限定理在发挥作用,尽管每个骰子的点数都不属于正态分布,但是六个骰子相加起来的点数服从正态分布。

具体实现代码如下

# 导入所需的库import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt# 正常显示中文标签mpl.rcParams["font.sans-serif"] = ["SimHei"]# 模拟骰子产生随机整数np.random.seed(666666)df = pd.DataFrame(np.random.randint(17, (100006)))# 对骰子点数求和df["总和"] = df.apply(lambda x: x.sum(), axis=1)# 对点数之和进行计数total = df.groupby(["总和"])["总和"].count()# 画图用的数据定义x = total.indexy = total.values# 使用「面向对象」的方法画图fig, ax = plt.subplots(figsize=(86))# 设置标题ax.set_title("六个骰子点数总和的分布", fontsize=26, loc="center")# 画柱形图ax.bar(x, y, width=0.6, color="#00589F")# 隐藏边框ax.spines["top"].set_visible(False)ax.spines["right"].set_visible(False)ax.spines["bottom"].set_visible(False)ax.spines["left"].set_visible(False)# 隐藏刻度线ax.tick_params(axis="x", which="major", length=0)ax.tick_params(axis="y", which="major", length=0)# 设置坐标标签字体大小ax.tick_params(labelsize=20)plt.show()

 

 

小结

虽然世界是复杂多变的,但是多种独立因素综合起来的结果,又能用简单直观的正态分布模型来解释,这充分体现了数学之美。

用数学和图表来展现分析思维模型,能够帮助我们更好地理解世界运行的规律。

掌握多种分析思维模型,能够提高我们推理、解释、设计、沟通、行动、预测和探索的能力,从而实现对世界更加细致的理解

 

 

End.

爱数据网专栏作者:林骥

作者介绍:数据赋能者,专注数据分析 10 多年。

个人公众号:林骥(linjiwx)

本文为挖数网专栏作者原创文章,未经允许禁止转载,需要转载请微信联系授权(微信号:lovedata0520)

更多文章前往爱数据社区网站首页浏览http://www.itongji.cn/

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: