数据分析终极一问:自然增长率,到底怎么算!
2022-09-22 11:25
数据分析领域有很多终极难题。如果你和营销、运营等部门打交道,最常遇到的问题一定有一个叫:自然增长率�? - 到底自然增长率怎么�?- 为啥我算出来的他们都说不合理 - 为啥他们给的自然增长率都这么�? # 一、什么是自然增长�? 自然增长率,是相对于人工增长率而言的。严格来说,在商业上是没有严格的自然增长率的,所有的业绩都是靠人做出来的,但是,有些部门是能直接产出业绩的,有的就只能打辅助,叠 buff�? 典型的直接产出业绩的,比如销售,直观的看,所有的业绩都是销售卖出来的。互联网的广告投放与此类似,投了广告,用户点击下来,就直接带来收入�? 典型�?buff 部门,就是品牌、营销、推广、用户运营、活动运营。他们是在销售、推广的基础上叠 buff�? 比如�? - 原本商品�?30 元,现在送个优惠券,�?5 �? 原本商品是食品,现在加个“吃个延年益寿”的宣传- 原本商品没牌子,现在加个“国际大牌”“驰名商标”是不是看起来牛逼一点了,买的人可能多一点?有可能,也没可能!总之很难说清楚�? 因此,这些部门就特别想输出一个自然增长率的概念。剥离出�?哪些是本来就有的自然销量,哪些是我的优惠券/积分/小礼�?赠品/广告/宣传�?等级/荣誉徽章”带来的。这就是自然增长率问题的起源�? 有意思的是,自从这帮人发明自然增长率以后,销售们也开始用这个概念,不过用法是:计算自然增长率是多少,然后证明大环�?天气/运营策划的傻逼活动产生了负影响,导致销售没做好了�? # 二、理论上的自然增长率
看起来想剥离品牌、运营、营销�?BUFF 很好解决。只要把销量区分为自然/人工两个部分就好了!
理论上,自然增长率有三种算法�? 方法一:按时间区分。没做活动之间是自然增长率,做活动期间是人工增长(如下图)�? 
注意:所谓无活动时间,也有好几种算法比如假设如左图,�?2 年内只有今年�?11 有活动(1 点),之前和去年都没有。那么理论上可以计算�?. 双十一�?1 个月做自然增长(冬季增长�? 点,因为有明显季节变化)2. 今年所有非活动期平均数(如 3,所有月份都算进来,因为这样能算低一点)3. 去年同期做参考(去年没做,今年做了,所以去年同期增长率*今年 10 月份业绩就是自然增长率)如果活动连续不断的做,这方法就废�? 方法二:按人群区分。没做活动的人是自然增长,做活动的是人工增长(如下图)�? 
注意:设参照组需要有前提
- 活动以封闭信息形式提�?
- 活动产品能及时消�?
- �?1 �?1 沟通用�? 如果不满足以上三点,用户会很容易发现有套利空间,就盖头换面混进活动组参加,或者干脆不消费,等自己有优惠!或者举报到市场监督管理局去�? 另,一单设参照组,参照组的质量就是决定胜负的关键。如果运营会数据分析,可以轻易的选出看似合格实则渣渣的用户丢进参照组,制造效果非常棒的假象�? 方法三:按产品区分。没做活动的产品是自然增长,做活动的是人工增长(如下图)�?

ABC 类商品全生命周期销量对�? 1 �?3 �?5 �?7 �?9 �?11 �?13 �?15 �?17 �?19 �?21 �?23 �?A �?B �?C �? 实际上,几乎没有无活动的商品,商品上市都要做铺货,退市都要做清仓,热销期间都会搞一些促销,搞一些捆绑销售所以更常用的办法,是先定商品的等级,商品属�?ABC 哪一类,定了等级以后,再制定商品生命周期销售计划,比如:上市期,在 X 周内应铺�?XXX 件热销期,�?X 周内应销�?XXX 件退市期,在 X 周内应清�?XXX 库存这个任务目标,就是自然销售目标这样业务含义也清晰,就是:你不能做的比同级别差。接地气字室
搞掂!多轻松。是滴,理论上确实这么轻松,但实际操作起来,麻烦就来了�? # 三、来自现实的挑战
挑战一:非活动时间数据不工整�? 从本质上看,顾客不会时时刻刻均匀的到店买东西。想逛街要等下班、等周末、等放假;想上网得等有空、摸鱼、娃睡了的时候。因此非活动期间数据本身就是高低起伏。到底�?3 个月平均?选最近一个月?选最近一周?经常因为这个事吵架�? # 挑战二:几乎天天做活动,没有非活动期�? 这个在零售、电商、游戏等行业都很常见,活动几乎天天都在做,无法选非活动期。或者非活动期只有两个大活动之间短短数周,本身处于大促结束后的回暖时期,根本不足为据。这样时间法基本就废掉了�? # 挑战三:商品属性、生命周期不同,无法类比�? 首先,很难选出一模一样的商品进行对比,两款商品或多或少存在差异。其次,商品本身的销量走势,也是人为做出来的。商品卖得好了需要加单,商品卖得差了需要清仓。因此眼前的销量很难被认定为:“自然”�? 挑战四:不是所有活动都适合划分参照人群�? 比如 618,双十一大促,还嫌参与的人不够多呢,不可能剔除某些人不参加。比如非电商渠道,非即时消费产品,如果搞区分人群定价,很容易引发窜货,或者被消费者举报到市场监督局,定一个“大数据杀熟”的罪名�? 挑战五:参照人群的划法,很难一碗水端平�? 即时分参照人群,也很难说明问题。因为最终要测试的是购买行为,而影响购买行为的变量很多。性别、年龄、过往购买频率、品牌忠诚度、促销敏感性等等因素都有影响,因此通过分析抽样,可以轻松做出来购买率很低的参照组,从而让 ABtest 失效�? # 挑战六:外部影响没有考虑�? 是滴,即使以上因素全部考虑,依然有人跳出来说:你没有考虑宏观环境/天气/政策/社群族群等等影响,总之,原本应该下�? 30% 以上的,你看 XX 同行就跌了这么多,所以我们下�? 20% 是正常的,嗯,是我们的成果�? 更深层地看,之所以有这么多乱七八糟的争论,本质就是两字:
甩锅
不是为了让自己的工作蓬荜生辉,谁又会这么卖力地推过揽功,舌花灿烂呢。你说的数让人家的绩效不好看了。人家就会找各种理由喷你,就这么简单�? # 四、理论上的破局
有没有合理的解决办法?理论上有!
解决的前提就是站在二层楼看问题,把屁股从小部门位置上挪开。思考到底做到啥程度真的对业绩有帮助,如何完成自己的任务,提高整体效率�? 首要要排除的就是把锅甩给外部因素。是否是外部环境变化,其实从数据上很好识别,只要满足四大条件就能说这是主要受外部影响(如下图)。但是,如果不能满足四大条件,仅仅是看到一条新闻报道、听说了同行的抱怨、就不拿来说事�? 
下雨跌,跌厉害,雨停了涨
拿经典的“下雨”借口为例
同时符合四个条件�? 1. 雨开始,指标�? 2. 指标掉的很厉�? 3. 雨持续,指标持续�? 4. 雨停了,指标恢复�? 这样才能说是:主要受外界因素影响
要不只能说:影响之一,更不要扯,有可能同样环境下,有人做的比你好得多,这时候就不接地气�? 其次,对于直接产生业绩的部门,根本就不要扯啥自然增长。达标就是达标,不达标就是不达标。只是看从呢不找办法,还是外部找办法�? 再次,对于叠 buff 部门,可以算自然增长。但是要分三大类型算�? 
简单来说,就是�? - 不背硬指标的,自己和自己过往�? 背硬指标但是有明确任务的,先完成任务- 背硬指标,且背整体指标的,关注整体,不纠结细节。整体不达标,你光哗哗我自己做的好,照样没人�? 背硬指标,且分群营销的,直接�?ABtest,不整虚�? 当然,还有最简单的办法,就是:买定离手法。所有人提前共识算法,用最�?X 周也好,用去年同期也好,总之,在项目开始之前共识好。之后买定离手,事后效果不好了自己反思原因。一开始不定好参照组,事后自然会百般狡辩�? # 五、现实中的无�? 然而以上仅仅是理论。现实中,无论怎样,都是:
- 负责�?buff 的运营总是想证明自己一手遮�? 负责销售的部门总是喜欢抱怨后台支持不给力- 负责监督的老板总有自己的小九九和衡量标�? 所以关于自然增长率的争吵,还会无穷无尽地进行下去。特别是,有时候数据分析岗位就是设在运营下边,运营的老板需要数据分析帮自己站台,这时候科学不科学,合理不合理就管不上那么多了。食君之禄,分君之忧,想办法圆过去就好。但是,作为数据分析师,自己得清楚游戏是咋玩的,这样再用各种方法圆故事的过程中,才能进退自如�? 其实细看之下,会发现,所谓的数据分析终极难题,从来都不是难在计算本身,而是难在各个部门都拿数据当枪使,屁股决定脑袋。当你想收集一个有利的数据证据的时候,你总能找到一个�