2022- 05- 21 17:30

做数据分析的同学们都见过下边这种矩阵,很多人对此顶礼膜拜,甚至还有一些网文作者直接就把矩阵思维、矩阵模型、矩阵法招呼上了,说它是数据分析的“底层思想”“核心逻辑”,好吧……肯定他们是没在咨询企业上过班了。其中真相如何,今天我们系统讲解一下�?

从平均值法说起

平均数是用得最多,也被调侃的最多的概念。有诗为证:

隔壁九个穷光蛋统计局里算一算各个都是张百万

但问题是,为啥平均数被吐槽这么多,实际上却又使用得最多?明明统计学里有平均数、中位数、众数三个概念,三个概念都很好理解,但为啥非是平均数呢?

答:因为平均数用起来方便、省事。用平均数,能很简单地把总量按人头分解,比如�? 销售金�? \(=\) 购买客户数*人均购买量生产数�? \(=\) 生产线数*平均产能备货�? \(=\) 门店数*平均销�? 这样在做管理的时候是很省事的:想提高销量,要么增加客户人数,要么提高人均购买。这两个数字可以简单地直接相乘。用中位数、众数显然达不到这个效果。并且,在下命令的时候也很清晰:每个人都要做到平均水平以上!你做不到,你就拖了大家的后腿,大家都能做到你凭什么做不到。你看,简单清晰,而且符合人们的直观感觉,很有说服力�? 所以平均数是自带标准的。高于平均值就是好,低于平均值就是不好。这一点对咨询顾问们来说非常重要。因为大部分咨询顾问,在特定行业里的经验远没有客户多。因此诊断问题的时候,咨询顾问们非常需要一个不依赖于行业的、中立的、有说服力的标准来判断好坏。判断完好坏,才能进一步分析为啥好、为啥坏。因此平均值法是用得最多的判断方法�? 当然,平均值法也有它的先天不足,这就引申出其他方法�? # 平均值法的迭代升�? 用平均数的问题,其实来源于个体差异过大,所谓:“我和姚明平均身高,和马云平均财富”,因此在平均值法的基础上,又引入了二八法:�?20/80 理论,直接把最好的�?20%

分离出来,单独观察,避免干扰其他群体,这样也能做出判断�?

二八法是一个统称,目的是拆除能力特别强的人,不见得非得按二八月来划分。实际操作的时候,有两种方法,一种是按数量比例,比如著名的二八划分法,取个人业绩排名�?20%的销�?产品/渠道作为第一梯队�?1%- 30%为第二梯队诸如此类类推。第二类则是根据单人产出能力分层,比如销售促�?20 单以上为第一梯队,或者销售转化率 50%以上为第一梯队。两种方法算法不同,但都能分出高低接地气字型

二八法一般在前台/营销端用得多。因为后�?供应端的生产、物流都是机器化流程,容易把控质量,但前�?营销端常常出现少数能力好的销售做出大量业绩、少数金主爸爸贡献大部分利润的情况。在管理上,进而衍生出淘金法。即�?100 个销售,要从里边培育�?20 �?Ace 级销售。类似挖一大堆沙,从里边淘出金子的过程�? 如果评价维度有两个呢?这就引申出了矩阵法�? # 从平均值法到矩阵法

矩阵法本质上是一种用两个维度来找判断标准的方法。它的操作非常简单:

第一步,找到两个评价维度,每个维度取平均值做判断标准。第二步,两个指标交叉,把待评价对象。第三步,根据两维度含义,给出分类解读�? 只要两个指标相关性不是非常高,两个指标交叉的时候,数据就会分散在四个矩阵里,这样能清楚找到业务含义(如下图)�?

矩阵法最大的好处,就是含义直接,很容易找到直观的业务含义,便于业务理解。而且矩阵采用的是两个维度对应数据的平均值,因此算起来容易,总能出结论。注意,如果构造矩阵的两个维度相关性太高,则所有点都会出现�?45 度斜线上,这时候矩阵失去判断力。所以尽量选不相关的两个维度�? 更有趣的是,如果两个评价维度组合得当,是能够解读出很多有意思的业务含义的。比如游戏行业的用户活跃/用户付费两个指标。可以起个:

�?高活�?+ 高付�?= 金牛用户(又出钱又出力的老牛)☆ 低活�?+ 高付�?= 土豪用户(懒得自己打,爷花钱买!)☆ 高活�?+ 低付�?= 白嫖用户(啦啦啦,就是干玩不给钱)☆ 低活�?+ 低付�?= 边缘用户(都不咋玩,要跑咯)

这样的解读能一下让报告的气氛活跃起来,结合所谓“矩阵模型”,显得既高大上,又活泼,这是甲方爸爸们最喜欢看的东西。因此矩阵模型便大行其道了,每个咨询公司在新员工培训的时候,都会教如何构建矩阵模型,让爸爸们满意。这是一个祖传手艺�? 所以你看到的咨询公司的所谓分析模型,出现最多的就是矩阵,各种矩阵。如果矩阵搞不掂,基本上就是什�?7 S�? P 之类的巨复杂,巨多分类维度的模型了。反应快的同学,看到

这立马就有疑问了。“诶?为啥会这样,理论上 3 个维度的评价,也能这样叠加下去呀,不就是拉交叉表吗。�? �?3 维度评价为例,即使每个维度都用二分类,那么能分出来的也有 \(2 \times 2 \times 2 = 8\) 类。这种情况下会出现几个问题:

1、每一类含义解读变得复杂,不见得都能解释清楚�? 2、每一类群体数量变少,经常出现一个群体占�? 50% ,另一个占�? 5% 的问�? 3、因为群体规模不均,经常引发客户:“我们再细分一下”的要求,结果拆得越支离破碎,解读越麻烦,而且有的客户,就�? 50% 用户消费、活跃都�?0,也没法继续深入

总之,原本用平均值法、用矩阵法,为的是简单、省事。现在反而人为的制造复杂性了。所以当评价维度超过 3 个以上的时候,咨询顾问们会倾向于放弃手动分类,直接用包含一大堆分类维度的综合评估模型。或者干脆上 K 均值聚类,对着聚出来的结果再拍脑袋解读�? 4

小结

所谓分析方法,都是有特定的使用背景、使用目的、使用效果的。而且并不是所有的分析方法,都是冲着“精准”去的。能快速、省事的解决问题,才是最终目的�? 这又是一件“君子以为文,小人以为神”的事。认真理解起背后的逻辑,就能进步。打着“权威、牛逼、科学”的幌子死记硬背,就把自己绕进去了�? 在咨询公司工作多年,对于各类分析模型的思路和使用方法,陈老师有独到的见解,想深入学习,达到真正提升能力的目标,赶紧加入陈老师的知识星球~