数据分析终极一问：自然增长率，到底怎么算！

因果分析核心方法，业务归因必备

发布于

2025年1月1日

2022-09-22 11:25

数据分析领域有很多终极难题。如果你和营销、运营等部门打交道，最常遇到的问题一定有一个叫：自然增长率�? - 到底自然增长率怎么�?- 为啥我算出来的他们都说不合理 - 为啥他们给的自然增长率都这么�? # 一、什么是自然增长�? 自然增长率，是相对于人工增长率而言的。严格来说，在商业上是没有严格的自然增长率的，所有的业绩都是靠人做出来的，但是，有些部门是能直接产出业绩的，有的就只能打辅助，叠 buff�? 典型的直接产出业绩的，比如销售，直观的看，所有的业绩都是销售卖出来的。互联网的广告投放与此类似，投了广告，用户点击下来，就直接带来收入�? 典型�?buff 部门，就是品牌、营销、推广、用户运营、活动运营。他们是在销售、推广的基础上叠 buff�? 比如�? - 原本商品�?30 元，现在送个优惠券，�?5 �? 原本商品是食品，现在加个“吃个延年益寿”的宣传- 原本商品没牌子，现在加个“国际大牌”“驰名商标”是不是看起来牛逼一点了，买的人可能多一点？有可能，也没可能！总之很难说清楚�? 因此，这些部门就特别想输出一个自然增长率的概念。剥离出�?哪些是本来就有的自然销量，哪些是我的优惠券/积分/小礼�?赠品/广告/宣传�?等级/荣誉徽章”带来的。这就是自然增长率问题的起源�? 有意思的是，自从这帮人发明自然增长率以后，销售们也开始用这个概念，不过用法是：计算自然增长率是多少，然后证明大环�?天气/运营策划的傻逼活动产生了负影响，导致销售没做好了�? # 二、理论上的自然增长率

看起来想剥离品牌、运营、营销�?BUFF 很好解决。只要把销量区分为自然/人工两个部分就好了！

理论上，自然增长率有三种算法�? 方法一：按时间区分。没做活动之间是自然增长率，做活动期间是人工增长（如下图）�?

注意：所谓无活动时间，也有好几种算法比如假设如左图，�?2 年内只有今年�?11 有活动（1 点），之前和去年都没有。那么理论上可以计算�?. 双十一�?1 个月做自然增长（冬季增长�? 点，因为有明显季节变化）2. 今年所有非活动期平均数（如 3，所有月份都算进来，因为这样能算低一点）3. 去年同期做参考（去年没做，今年做了，所以去年同期增长率*今年 10 月份业绩就是自然增长率）如果活动连续不断的做，这方法就废�? 方法二：按人群区分。没做活动的人是自然增长，做活动的是人工增长（如下图）�?

注意：设参照组需要有前提

活动以封闭信息形式提�?
活动产品能及时消�?
�?1 �?1 沟通用�? 如果不满足以上三点，用户会很容易发现有套利空间，就盖头换面混进活动组参加，或者干脆不消费，等自己有优惠！或者举报到市场监督管理局去�? 另，一单设参照组，参照组的质量就是决定胜负的关键。如果运营会数据分析，可以轻易的选出看似合格实则渣渣的用户丢进参照组，制造效果非常棒的假象�? 方法三：按产品区分。没做活动的产品是自然增长，做活动的是人工增长（如下图）�?
ABC 类商品全生命周期销量对�? 1 �?3 �?5 �?7 �?9 �?11 �?13 �?15 �?17 �?19 �?21 �?23 �?A �?B �?C �? 实际上，几乎没有无活动的商品，商品上市都要做铺货，退市都要做清仓，热销期间都会搞一些促销，搞一些捆绑销售所以更常用的办法，是先定商品的等级，商品属�?ABC 哪一类，定了等级以后，再制定商品生命周期销售计划，比如：上市期，在 X 周内应铺�?XXX 件热销期，�?X 周内应销�?XXX 件退市期，在 X 周内应清�?XXX 库存这个任务目标，就是自然销售目标这样业务含义也清晰，就是：你不能做的比同级别差。接地气字室

搞掂！多轻松。是滴，理论上确实这么轻松，但实际操作起来，麻烦就来了�? # 三、来自现实的挑战

挑战一：非活动时间数据不工整�? 从本质上看，顾客不会时时刻刻均匀的到店买东西。想逛街要等下班、等周末、等放假；想上网得等有空、摸鱼、娃睡了的时候。因此非活动期间数据本身就是高低起伏。到底�?3 个月平均？选最近一个月？选最近一周？经常因为这个事吵架�? # 挑战二：几乎天天做活动，没有非活动期�? 这个在零售、电商、游戏等行业都很常见，活动几乎天天都在做，无法选非活动期。或者非活动期只有两个大活动之间短短数周，本身处于大促结束后的回暖时期，根本不足为据。这样时间法基本就废掉了�? # 挑战三：商品属性、生命周期不同，无法类比�? 首先，很难选出一模一样的商品进行对比，两款商品或多或少存在差异。其次，商品本身的销量走势，也是人为做出来的。商品卖得好了需要加单，商品卖得差了需要清仓。因此眼前的销量很难被认定为：“自然”�? 挑战四：不是所有活动都适合划分参照人群�? 比如 618，双十一大促，还嫌参与的人不够多呢，不可能剔除某些人不参加。比如非电商渠道，非即时消费产品，如果搞区分人群定价，很容易引发窜货，或者被消费者举报到市场监督局，定一个“大数据杀熟”的罪名�? 挑战五：参照人群的划法，很难一碗水端平�? 即时分参照人群，也很难说明问题。因为最终要测试的是购买行为，而影响购买行为的变量很多。性别、年龄、过往购买频率、品牌忠诚度、促销敏感性等等因素都有影响，因此通过分析抽样，可以轻松做出来购买率很低的参照组，从而让 ABtest 失效�? # 挑战六：外部影响没有考虑�? 是滴，即使以上因素全部考虑，依然有人跳出来说：你没有考虑宏观环境/天气/政策/社群族群等等影响，总之，原本应该下�? 30% 以上的，你看 XX 同行就跌了这么多，所以我们下�? 20% 是正常的，嗯，是我们的成果�? 更深层地看，之所以有这么多乱七八糟的争论，本质就是两字：

甩锅

不是为了让自己的工作蓬荜生辉，谁又会这么卖力地推过揽功，舌花灿烂呢。你说的数让人家的绩效不好看了。人家就会找各种理由喷你，就这么简单�? # 四、理论上的破局

有没有合理的解决办法？理论上有！

解决的前提就是站在二层楼看问题，把屁股从小部门位置上挪开。思考到底做到啥程度真的对业绩有帮助，如何完成自己的任务，提高整体效率�? 首要要排除的就是把锅甩给外部因素。是否是外部环境变化，其实从数据上很好识别，只要满足四大条件就能说这是主要受外部影响（如下图）。但是，如果不能满足四大条件，仅仅是看到一条新闻报道、听说了同行的抱怨、就不拿来说事�?
下雨跌，跌厉害，雨停了涨

拿经典的“下雨”借口为例

同时符合四个条件�? 1. 雨开始，指标�? 2. 指标掉的很厉�? 3. 雨持续，指标持续�? 4. 雨停了，指标恢复�? 这样才能说是：主要受外界因素影响

要不只能说：影响之一，更不要扯，有可能同样环境下，有人做的比你好得多，这时候就不接地气�? 其次，对于直接产生业绩的部门，根本就不要扯啥自然增长。达标就是达标，不达标就是不达标。只是看从呢不找办法，还是外部找办法�? 再次，对于叠 buff 部门，可以算自然增长。但是要分三大类型算�?

简单来说，就是�? - 不背硬指标的，自己和自己过往�? 背硬指标但是有明确任务的，先完成任务- 背硬指标，且背整体指标的，关注整体，不纠结细节。整体不达标，你光哗哗我自己做的好，照样没人�? 背硬指标，且分群营销的，直接�?ABtest，不整虚�? 当然，还有最简单的办法，就是：买定离手法。所有人提前共识算法，用最�?X 周也好，用去年同期也好，总之，在项目开始之前共识好。之后买定离手，事后效果不好了自己反思原因。一开始不定好参照组，事后自然会百般狡辩�? # 五、现实中的无�? 然而以上仅仅是理论。现实中，无论怎样，都是：

负责�?buff 的运营总是想证明自己一手遮�? 负责销售的部门总是喜欢抱怨后台支持不给力- 负责监督的老板总有自己的小九九和衡量标�? 所以关于自然增长率的争吵，还会无穷无尽地进行下去。特别是，有时候数据分析岗位就是设在运营下边，运营的老板需要数据分析帮自己站台，这时候科学不科学，合理不合理就管不上那么多了。食君之禄，分君之忧，想办法圆过去就好。但是，作为数据分析师，自己得清楚游戏是咋玩的，这样再用各种方法圆故事的过程中，才能进退自如�? 其实细看之下，会发现，所谓的数据分析终极难题，从来都不是难在计算本身，而是难在各个部门都拿数据当枪使，屁股决定脑袋。当你想收集一个有利的数据证据的时候，你总能找到一个�