数据分析的4个步骤及如何把每个步骤做更好

挖数小助手
挖数小助手
挖数小助手
4
文章
0
评论
2020-05-2517:32:28 评论 1,715 3900字

数据分析是当前比较火的一个职业,这个职业要做好,是否存在一定的方法可以让结果更好呢?如下是基于鄙人工作经验总结的一些心得,希望对大家能有所帮助。主要从分析四步骤及如何把每个步骤做到更好的方法来进行总结告的类型。

一、分析思路

1.确认分析点

为什么要做这个呢?往往数据需要分析的点不是分析师自己发起,而是业务发起,但他们往往不能第一时间描述清楚自己的问题和真实需求,所以需要分析师协助其更好的理解自己真实的诉求,清楚的解读这个问题到底是什么。

2.思路梳理

将问题进行切割梳理,为后面有条理有目的的深入看数据做准备,每条思路都存在一种基于业务认知的预设假设,而后再利用数据去判断假设是否成立。

3.收集信息

基于步骤2梳理的思路,收集相关信息,主要包括业务在什么时间点做过什么调整决策、和这个主题相关的内部外部信息等等。

4.深入分析

基于梳理的思路及掌握的信息,结合数据逐个去验证每个假设对结果的影响。看数据时可能会产生新的思路,可返回完善思路。

如上四步骤是为了更好的理解所以拆分开,但实际工作中每步是互通的,如收集信息时发现思路有缺失,如看数据时发现之前的思考缺失,都可返回补充完善思路。

二、如何把上述四步骤做的更好呢?

1.如何更好的确认分析点

(1)问题

对方在表达需求时,很多时候是自己习惯性的语言,缺乏专业的数据背景,导致表达不得要领,需要基于专业的引导帮助找到真实的问题

(2)方法

和对方交流时换个方式,用您做这件事的目的是什么,想解决什么问题?”替换对方字面的意思,再基于自己数据的专业,给予对方更专业的引导,让彼此达成一致。

(3)案例

A=业务;B=初级分析师;C=资深分析师

A:能否帮拉下通过XX收银机卖的TOP20商品

B:准备给对方提供前30天销售额最好的20支商品

C:B,可稍微缓缓,我们来交流一下,想问个问题,你觉得她问的问题是什么?

B:她要XX收银机卖的最好的TOP20商品,所以准备给销售额最好的

C:为什么会直接给销售额TOP20,是不是本能反应觉得对方要的是销售额TOP20?

B:是的,因为一直以来都把卖的最好的普遍定义为销售额最好的

C:好,那我们换个角度往深再想一下,她提出来卖的最好的商品这句话背后实际意义是什么?做这件事的目的是什么,如果不清楚可以和对方交流下,提个醒“问问他拿这些数是想干什么事情”

B找到A,并进行如下交流

B:你好,请问你要那个数据做什么

A:是想给XX收银机的商品做个推荐排序,看哪类商品最受客户欢迎

B:其实是要看人流最高的商品,用售卖订单量最高的商品,是不是更合适

A:是的是的,是这个样子

2.如何梳理思路切分问题

(1)问题

思路梳理的好坏,直接影响深入分析的产出,能否更完整的对问题进行诊断,能否更清晰的去用数据看问题

(2)方法

1.找到影响的直接结果因素A,B,C等等

2.基于a,找到影响每个结果因素的因素,如影响A的A1,A2,A3等等

3.基于a和b,穷举出对问题结果可能影响的思路

(3)案例

以客单价为例,应用场景:当客单价下降,找到下降的缘由

1)直接因素

客单价

·=销售额/客流

·=商品1的金额+..+商品n的金额)/客流

·=(客户1的金额+...+客户n的金额)/客流

2)间接因素

·销售额=商品1的售价*数量+商品2的售价*数量+....+商品n的售价*数量

·商品n的金额=不同价格区间商品金额=不同品类价格区间的商品金额总和=售卖的SKU数越多,n越大

·客户n的金额=不同价格区间的客户分布

·数量=备货是否足够,市场诉求是否下降

3)穷举出影响的因素:

·不同单价商品的销售对结果的影响,价格有区间,看区间销售分布

·提供给客户的商品选择范围,对客户购买商品的SKU分布影响

·备货是否足够,缺货导致可选择的商品种类变少,丰富度降低

·单笔金额的客户分布情况,不同消费能力的用户是否变化,各自贡献如何

·市场诉求是否变化

3.如何收集信息

(1)方法

对内

·梳理完整的业务工作流,可从系统使用、业务流程、人员架构入手

·基于工作流找到关键环节,如使用系统收货、促销活动制定、盘点等

·针对关键环节收集近期与其相关的信息,如是否调整、做了什么调整

对外

·外部市场竞争对手

·相关政策调整

·黑天鹅事件

(2)案例

销售额下降为例

对内:

·工作流-系统:新系统上线,大家学习使用

·工作流-业务流:暂无调整

·工作流-人员架构:售卖的负责人、商品采购负责人都进行了重大调整

对外:

·竞争对手:新开了两家店

·政策调整:垃圾分类

·黑天鹅事件:新冠疫情的爆发

4.如何深入分析

(1)深入看数据的通用方法及关键点

由粗到细

可协助初步定位发生问题的点,核心是找到切分问题的维度,维度取决于行政架构、业务模型,一般零售企业可从人、货、场切入

·人:购买用户进行分类

·货:售卖的全部商品及商品分类,如卖肉的里面分前腿肉和后腿肉,水果有进口和国内

·场:售卖的区域及划分,有国家通用的行政区域,如全国->省->市->县->门店,企业的区域划分,如华东大区->某区域->某门店

粒度组合

·粒度数据由不同维度交叉组合而成,同一度量值在不同粒度下的变化趋势,可帮助精准定位问题及找到可能的机会

·如:江苏区19年3月(区域维度=江苏区,时间维度=19年3月);华东区19年的猪肉(区域维度=华东区,时间维度=19年,商品维度=猪肉)

度量值

是衡量业务实际表现的指标,不同度量值之间存在此起彼伏或间接相关的关系

·如:销售提升毛利提升,客流上升客单却下降,这种关系对于分析很关键

对比对象

·无对比无惊喜,很多惊喜源于对比,选择合适的对比对象很关键

·通用对比:空间对比(如:不同区域对比),时间对比(如:不同年同月份对比),流程对比(如:下单量对比到货量),但对比往往取决于实际看数过程的一些拆分组合,但也都基于原始维度的拆分,万变不离其宗

(2)实际看数据的流程

步骤一:初步定位问题出现的地方

找到问题发生的地方,帮助下一步有针对的进行问题产生的原因进行分析,两个关键点可帮助做的更好

·关键1:选择最合适的角度切入,核心取决于业务形态的主要组成维度,如零售的主要维度是门店区域和商品种类

·关键2:为后续分析提供新的对比维度视角,因为问题发生可能不是全面性,而是局部,局部之间的对比有优劣势,从中可对比出很多的机会点

步骤二:验证思路,找到原因

结合步骤一和前期梳理的思路进行逐一验证,找到问题产生的原因,3个关键点可帮助做的更好

·关键1:如何将步骤一确定的出现问题的地方与梳理的思路结合起来看

·关键2:验证过程很有可能产生新的思路,即使是新的,也都基于相类似的业务,可返回把之前梳理思路的过程再来一遍,补充完善

·关键3:选择合适的对标对象很重要,一般基于90%相同的条件+关键条件有差异的方式选择对标对象,这样可更好的验证结果与有差异的因素的强相关性

5.如何找到合适的数据指标来衡量业务问题

数据指标在每个步骤都是内含的,所以单独列出来详细说明一下

(1)问题

数据指标是怎么来的,不同业务场景,数据指标可选择的范围又有哪些呢?

(2)方法&案例

数据指标由各种维度和度量值进行组合而成的,找到合适的维度和度量,可协助找到合适的数据指标

维度

·案例如下

·时间:自然日=日、周、月、年、同节日;季节=春季、夏季、秋季、冬季;节日=中秋节、春节、五一劳动节、清明

·空间:地域=国家、省、市、县;流程=引入、上架、下单、发货、收货、售卖、退货;渠道=门店、天猫、淘宝、京东;

·逻辑:归属关系=商品种类-部类、商行、课组、中类、小类

度量值

零售案例如下,通过人货场拆分

·人:新客、老客、流失客户;高单价客户、低单价客户

·货:售卖、进货、库存等等

售卖=销售额、销量、平均售价、毛利额、毛利率

进货=下单量、到货量、数量到货率、下单额、到货额、金额到货率

库存=库存量、库存额、库存周转、高库存额、无效品库存额

·场:费用、成本

费用=人力费用、营销费用、房租、水电费等等

成本=商品成本、固资折旧等等

(3)应用数据指标的关键点

·度量值的对比需在同一体量之内,若不在,需做归一化处理

如不同门店不同售价区间的销售对比,用销售额直接对比不合理,需换成销售贡献,因为不同门店本身体量的上限存在差异

·基于原始维度衍生的新维度,随着看数据的深入,对比维度对随着对比对象的变化而调整,让数据的可参考性更强

如原本按照行政区域划分门店群,但看客单价问题时,不同门店群的表现有一定的分类聚集性,此时需重新调整门店群的划分,基于客单价不同进行划分,而非行政区域

·新维度的度量值,需基于该场景下真实数据而合理划分

如售价区间,需看商品价格的分布来确认区间值的划分,不能拍脑袋,不同业务形态单价差异很大,卖衣服单价300以100元的差异划分,超市单价10块以1元的差异划分

·选择合适的数据指标衡量该因素对整体的影响是否足够大,可帮助快速判断是否需要深入分析,提高工作效率

如衡量售卖商品中折扣对整体的影响,可先用打折产生的销售额占总体销售的占比进行判断,若体量太小,则不需继续深入分析操作,避免人力物力的浪费。

·非数据参考的重要性

有些数据结论不是单纯从数据得出,而是实地调研+数据结合判断,才可更好的验证结论,如门店人员对系统操作的匮乏,不知道怎么订货,从而导致缺货

写在最后:本文是总结的方法套路,具体怎么在一个个实际案例中实现,会在后续的文章中做一些分享的,欢迎交流

End.

爱统计网专栏作者:芒果数

作者简介:零售业的数据从业者,负责过团队,做过从0到1的数据产品,深入业务团队数据工作,完成了数据职业闭环

个人微信公众号:芒果树(ID:DataMama2020)

爱统计网专栏作者原创文章,如转载请微信公号后台与作者联系

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: