一文搞懂数据异常问题该如何分析

挖数网精选
挖数网精选
挖数网精选
446
文章
0
评论
2021-09-1014:12:19 评论 812 2097字
摘要

数据异常监控分析不仅是数据分析面试中的高频考题,同时也是业务分析中一项常态化的工作内容。当出现了数据异常波动的情况,应该如何进行分析呢?本文作者对此发表了自己的看法,与你分享。

一、数据异常波动的表现形式

数据异常监控分析不仅是数据分析面试中的高频考题,同时也是业务分析中一项常态化的工作内容。当我们面对市场、产品、运营等各种业务场景,经常会发现很多异常数据的问题,比如:

  1. 某APP日活DAU相比昨日突然下降了10%,该如何分析?
  2. 某公司销售收入环比上月下降了15%,该如何分析?
  3. 某产品客单价环比上月下降了20%,该如何分析?
  4. ……

上述各种业务场景,其实都是发现了数据有异常波动的情况,那接下来问题来了,我们该如何着手进行分析呢?大部分人解决问题的思路,都是直奔主题找原因,上来就去找出现异常的原因、异常点在哪里。其实这种分析思路有一个最大的弊端就是不够体系化,往往能够找到一些原因,但是很可能是片面的,甚至可能还会踩雷。接下来就给大家分享一种比较实用的方法,我个人称之为"点 – 线 – 面"分析法。

二、数据异常分析的方法论

一文搞懂数据异常问题该如何分析

1. 点

首先排查数据准确性,确定是否属于数据错误。容易出现数据错误的环节有数据采集环节(埋点)、数据提取环节、产品环节(BUG)、业务环节(数据口径)等。如果没有问题进入下一步分析;

2. 线

拉长时间周期,也就是进行纵向分析,看是否属于周期性波动,有些行业受季节或淡旺季影响较大,比如家电、饮料、在线教育等都受淡旺季影响较大。如果没有问题进入下一步分析;

3. 面

首先,综合运用公式拆解法、多维度拆解法等对大问题进行拆解,拆解为一个个可着手分析的小问题;然后,通过计算影响系数初步定位到主要影响原因;最后,大胆假设,小心验证,通过假设检验法逐步排查到产生问题的根本原因。

比如,我们以销售收入下降为例,通过"点 – 线 – 面"分析中的"点 – 线"分析确认属于数据异常后,接下来就可以在""的分析环节中采用"三部曲分析"法,主要流程如下:

1)运用公式拆解法、多维度拆解法等对大问题进行拆解

一文搞懂数据异常问题该如何分析

2)计算影响系数,定位主要原因影响系数=( 细分项本月数 -细分项上月数 ) / ( 本月总量 – 上月总量 )

影响系数越大,说明该维度数据就是造成总体波动的主要影响因素。

3)通过假设检验法逐步排查根本原因

假设在计算影响系数后,初步确定主要是新用户减少引起的收入下降,接下来就需要对新用户数下降的原因进行假设,常见的假设维度有内、外部维度,其中内部维度主要有渠道侧、产品侧、运营侧、技术侧等等,然后通过数据逐一对上述假设进行验证。

一文搞懂数据异常问题该如何分析

以上是几种常见的拆分维度,通过初步拆分,定位原因大致范围。

三、数据异常分析的案例实战

某连锁零售集团最近两年每月销售收入保持稳中有升的趋势,但是在2021年6月销售收入突然下降了17%(下图),这时销售负责人非常着急,让你尽快排查一下销售下跌的原因。面对收入下降这种棘手的问题,如果对于没有经验的同学,确实还是比较头疼的,就像那烫手的山芋,无从下手。

接下来,我们就按照按照上面的套路来演练一下。

一文搞懂数据异常问题该如何分析

1. 点

首先排查数据准确性,确定不属于数据错误;

2. 线

拉长时间周期,不属于季节波动;

3. 面

1)首先把总收入拆分成新、老用户收入

如下图:

一文搞懂数据异常问题该如何分析

通过观察数据,发现新、老用户收入均有不同程度下滑,于是启动第二步,分别计算其影响系数。

2)计算新、老用户收入影响系数

新用户收入影响系数 =(33 – 47) /(100- 120) =0.7

老用户收入影响系数 =(67 – 73)/(100- 120) =0.3

新用户收入影响系数0.7,说明总收入下降主要影响因素是新用户收入下降,明确问题的范围后接着进行细分,新用户收入的构成是什么?

新用户收入 = 新用户数量*转化率* 客单价

通过调取数据分析发现,新用户转化率和客单价都保持稳定,那么问题就出在了新用户数量这个指标上,那新用户又是由什么构成呢?

新用户 = 渠道 1 + 渠道 2 + 渠道 3 + …… + 渠道 n

于是我们把新用户按照其渠道来源进行拆分:

一文搞懂数据异常问题该如何分析

通过对新用户渠道来源进行拆分,我们发现渠道1在2021年6月新用户数量下降非常严重,于是我们就定位到收入下滑的根本原因在于渠道1新用户数量下滑严重。接下来我们就可以启动第三步,对渠道1新用户数量下滑原因进行假设检验。

3)对渠道新用户数下滑原因进行假设检验

渠道流量下降可能的原因可以从两个大的维度进行考虑:对于外部维度,可以考虑外部环境变动、竞品变化等;对于内部维度,可能的原因有渠道线索问题、投放策略变化等。这个时候一方面要调取数据进行分析验证,另一方面需要联系渠道1的负责人一起定位具体原因,找到具体原因后,再对症下药。

本案例纯属虚构,如有雷同,纯属巧合。当然,实际的业务要比这复杂的多,需要考虑的因素也很多,花费的时间也会更长。但是,解决问题的方法论和流程是可复用的。相信大家以后再面对类似问题的时候,会有一个清晰的分析思路和明确的入手点。

最后,我们如果对上面的"点 – 线 – 面"分析法进行总结归纳的话,可以提炼为下面这张图:

一文搞懂数据异常问题该如何分析

希望这一篇能够对大家准备面试和实际工作有切实的帮助,如果同学觉得有帮助,欢迎点赞、转发啊!大家如果有其他想法,欢迎加入我一起讨论交流。

End.

作者:知了数据分析

本文为转载分享,如果涉及作品、版权和其他问题,请联系我们第一时间删除(微信号:lovedata0520)

更多文章前往首页浏览http://www.itongji.cn/

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: