2021- 07- 25 17:42
很多同学最怕听“建模型”任字。尤其是建立“业务分析模型”。往往自己辛辛苦苦搞的 LR、SVM、CNN 被业务方狂喷�? 你这都是啥东西!脱离业务!不切实际!
所以到底什么是“业务分析模型”,又该怎么建?我们今天系统讲解一下�? # 业务分析模型是什�? 首先,一个正儿八经的分析模型得包含三个条件:
1、有合理的逻辑 2、有明确的目�?3、有数据的支�? 所以,首先得把 SWOT,PEST�? P 之流的垃圾扫出“模型”队伍。因为这些玩意有逻辑、有目标,但很难用数据进行论证。不信你看那些什�?SWOT,PEST 的报告,四个框框里都没几个数字,即使有数字也很难论证:到�?90 后比 80 后减�?5000 万会对我们业绩产生几百万影响。无法量化计算的,不算分析模型。它们只是拿来美�?ppt 的�? 业务分析模型的重点,在“业务”两个字。得让业务参与得进来,看得懂,能应用的,才叫业务分析模型。显然,我们不能指望产品经理、销售、运营、售后、物流的人去学《机器学习》《数学建模》《统计学》《python 编程》所以数据分析师们经常打交道的算法模型就不要在这里用了——业务看不懂,参与不进来,问题解决不了,当然会喷没有用�? 有的同学会疑惑:可我的领导只会提“建个模型”,说不出是业务模型还是算法模型,我怎么区别呢?有个最简单的原则是:非技术出身的领导�?90% 以上讲的是业务模型(剩下 10% 是他在朋友圈看了个协同过滤、神经网络之类的名字,然后临时起意想搞一下)�? 当然,想更准确判断,你可以仔细问�? - 是有监督问题还是无监督问�? 用什么算法你有心选没�? 需不需要业务参与进来判�? 我用对业务而言纯黑箱的做法行不�? 既然要聚焦业务,自然下一步得详细了解�? 1、到底针对哪个业务部门?2、业务流程是什么样子?3、有哪些数据采集�?、当前问题状态如何?
有了这些,我们可以具体讨论,该如何建模�? 
现状描述模型
当单个指标不能全面描述现状的时候,就得一系列指标有逻辑地呈现,以全面描述现状、发现问题,这是所谓:现状描述模型。业务常见逻辑�?2 种:串联式、并联式�? 串联式模型用于描述一个前后分 n 个阶段的流程,需要完成一步再到下一步。从流程起点开始,到终点结束;
并联式模型描述一个任务分开同时由各个线独立完成。从总目标开始,到执行任务的最小单位结束(如下图)�? 
一般实体企业分布各地的销售是独立运作的,因此实体企业用并行方式构建模型比较多。类似的还有销售团队,话务小组,各独立运营产品线等
B 2 C 线上零售

B 2 B 跟单

一般互联网业务的转化路径更长,因此需要串联结构,看每一步的数量,向下一级的转化率。注意:主要流程长,都有这种转化路径。比�?B 2 B 业务
因此梳理业务流程的时候,需要关注业务上下游部门、兄弟部门是如何协同的,从而构建出来。实际业务流程,可能既有串联,又有并联,比如我们常说的杜邦分析法,就是如此(如下图)�? 
现状描述型模型的最大作用是:清晰责任,暴露问题。因为一般各个子部门,上下游部门各有自己�?KPI,因此监控进度、复盘成果的时候,哪个环节掉链子一清二楚�? 所以在销售管理、运营管理中用得特别多。但注意:现�? \(\equiv / =\) 问题,现�? \(^+\) 标准 \(\equiv\) 问题。因此只有标准单一且明确的时候才能直接看出问题来。如果标准本身很复杂,则需要更进一步的
手段�? # 问题分类模型
如果判断一个指标好坏的标准只有一个,比如成本、利润,这时候是不需要模型的。大家都知道成本越低越好,利润越高越好,业务完全可以直接给判断标准�? 如果判断业务好坏需�?2 个标准,且这两个标准相关度低,这时候可以用矩阵模型来进行分类。常见的重要紧急矩阵,波士顿矩阵,质量/数量矩阵,都是这个原理(如下图)�? 
| 评价方法 | 方法分类 | 过程概述 | 优点 | 缺点 |
| 专家权重 | 主观评估 | 开专家会,直接给各个指标权�?/td> | 有专家参与,直观体现领导意志 | 波动大,不稳定,最后变成等老板批示 |
| AHP | 主观评估 | 开专家会,给各个指标两两相对重要性,再计�?/td> | 有专家参�?科学计算,结果稳�?/td> | 老板意志不能直接体现,可能被老板挑战 |
| DEA | 客观评估 | 给出投入、产出指标,直接用线性规划计�?/td> | 含义直接(投入产出比),需要变量少,一定能出结�?/td> | 给出的是一群对象比较的相对效率,有可能出“窝子里挑将军”问�?/td> |
| 神经网络 | 客观评估 | 标识:好/坏结果,直接训练模型,利用模型判断新样本好坏 | 专业度高,能考虑大量参数 | 过程完全黑箱,老板难理解,容易被怼翻 |
| 只要评估指标超过 3 个,就很难平衡各方意见,强烈建议用最简单的方法:设指标主次,一个个按顺序比较,不纠结,大家都能懂! | ||||
工作计划模型
在给定业务限制条件的情况下,经常出现最优化问题。比如给定了各个部门工时成本,求一个最优任务分配。这时候就是工作计划模型。最常见的就是解线性规划,在工作调配的时候用得非常多(如下图)�? - 有两款产�?A、B 需要备货,总量 350,A 商品起订�?125,A 生产工时 2 小时/件,B 生产工时 3 小时件,A 成本 2 元,B 成本 3 元,问如何安排生产?
- 目标:min 2 A+3 B 由于营销/销售端可以大力出奇迹,且充满约束条件:A�?25 不确定性(不知道客户会不会响应),因此虽然理论上可以用同样方法分配任务,但实际上更倾向于投资源/打鸡血 2 A+B�?00 线性规划方法在供应链用的更多,营销/销售给到供应链的总目标是固定的,剩下的就是如何分配任务,调动产能的问�? # 未来预测模型
所有预测的基本假设,都是:未来发生的规律和过去一样,过去的场景会在未来重现。所以业务做预测的时候,常常会假设一些业务参数是固定的,然后推测未来情况�? 常见的做法,比如�? 常见的做法,比如�?、假设生命周期走势是不变的,推测未来情况 2、假设转化率/留存率是不变的,推测未来情况 3、假设投入产出比是不变的,推测未来情�? 
按固定比率预�?
| T+1 | T+2 | T+3 | T+4 | T+5 | T+6 | |
| DNU 1 | 60% | 45% | 35% | 15% | 15% | |
| DNU 2 | 58% | 44% | 33% | 15% | ||
| DNU 3 | 57% | 43% | 34% | |||
| DNU 4 | 61% | 46% | ||||
| DNU 5 | 59% | |||||
| DNU 6 |
比如商品上市上线,都有明显的引入- 上升- 稳定- 衰退过程,往往在预测时先评级,根据商品性能、价位、市场推广力度,评为 ABC 级的某一个,然后直接套这个级别的走势做预测。某些生命周期明显的 APP(比如游戏)也能这么简单预�? 比如左图,在 T+4 以后,新用户当期活跃率稳定在 15%,此�?DAU 6=DNU 6+DNU 1+15%+DNU 2+15%+DNU 3+15%+DNU 4+34%+DNU 5+45%留存率稳定的情况下,就能沿着趋势继续推,模拟活跃用户走势,从而推算留存率�? 在一些发展稳定的行业里,这些假设常常很准。但注意,有三种情况下假设可能失效�? 1、新业务、新场景导致无历史数据可参照�?、突发且情况不明,导致所有转化率都异常�?、业务运作出现明显问题,已无法按正常走势反推�? 这时候要么更换预测方法,要么做足预案,提前准备后路。单纯指望预�?100 准,不论是业务模型还是算法模型,都会出问题�? 06
什么时候用算法模型
看完以上,有同学会好奇:看起来业务模型能做很多事啊,那什么时候用算法模型呢?注意:算法模型本身的强项,就不是解决经营问题。算法模型的强项是图像识别、语义识别、复杂场景下动态规划。这些才是算法该发挥用处的地方�? 就拿推荐算法举例�? 1、商品有固定的搭配。比如治疗感冒就�?VC+银翘,这叫:固定业务逻辑,这时候是不需要算法来推荐的,直接按业务逻辑走就好了�? 2、商品无固定搭配,但业务方想推。比如保健品利润高,无论如何业务方都想推保健品,这叫:强业务关联。这时候也不需要算法来推荐,而是业务方得创造话术、广告、卖点、销售技巧,千方百计地去洗脑,特别是针对大爷大妈洗脑�? 3、商品无固定搭配,且业务方无明确目标。比如天猫淘宝抖音这种,SKU 数以亿计,这时候业务逻辑完全理不清,就可以上推荐算法,而且推荐算法目标常常�?GMV 最大,用户活跃时长最长一类�? 类似地,找算法模型的应用场景,得主动回避开固定业务逻辑、强业务关联——找那些业务不知道、不清楚情况、无力加以控制的场景�? 比如�? 1、全新业务上线,谁都说不准,没经验参�?2、预测整体走势,不考虑细节,先看基本面
3、业务无计可施,怎么做响应率就是上不�?4、考虑变量太多,用肉眼人手难以分类清楚
这时候可以大胆让业务逻辑退居二线,尝试用算法解决问题。可以名正言顺地跟业务说:这就是个黑箱。我们观察结果就好了——反正他们也没更好的办法,如果能做出成绩来,就是大功一件�? 当然,以上和我们今天的话题没关系。大家先学会如何在业务参与的情况下工作。如果有兴趣看算法模型在商业问题上如何发挥作用,本篇集齐 60 在看,我们下一篇分享。敬请期待哦�