2021- 07- 25 17:42

很多同学最怕听“建模型”任字。尤其是建立“业务分析模型”。往往自己辛辛苦苦搞的 LR、SVM、CNN 被业务方狂喷�? 你这都是啥东西！脱离业务！不切实际！

所以到底什么是“业务分析模型”，又该怎么建？我们今天系统讲解一下�? # 业务分析模型是什�? 首先，一个正儿八经的分析模型得包含三个条件：

1、有合理的逻辑 2、有明确的目�?3、有数据的支�? 所以，首先得把 SWOT，PEST�? P 之流的垃圾扫出“模型”队伍。因为这些玩意有逻辑、有目标，但很难用数据进行论证。不信你看那些什�?SWOT，PEST 的报告，四个框框里都没几个数字，即使有数字也很难论证：到�?90 后比 80 后减�?5000 万会对我们业绩产生几百万影响。无法量化计算的，不算分析模型。它们只是拿来美�?ppt 的�? 业务分析模型的重点，在“业务”两个字。得让业务参与得进来，看得懂，能应用的，才叫业务分析模型。显然，我们不能指望产品经理、销售、运营、售后、物流的人去学《机器学习》《数学建模》《统计学》《python 编程》所以数据分析师们经常打交道的算法模型就不要在这里用了——业务看不懂，参与不进来，问题解决不了，当然会喷没有用�? 有的同学会疑惑：可我的领导只会提“建个模型”，说不出是业务模型还是算法模型，我怎么区别呢？有个最简单的原则是：非技术出身的领导�?90% 以上讲的是业务模型（剩下 10% 是他在朋友圈看了个协同过滤、神经网络之类的名字，然后临时起意想搞一下）�? 当然，想更准确判断，你可以仔细问�? - 是有监督问题还是无监督问�? 用什么算法你有心选没�? 需不需要业务参与进来判�? 我用对业务而言纯黑箱的做法行不�? 既然要聚焦业务，自然下一步得详细了解�? 1、到底针对哪个业务部门？2、业务流程是什么样子？3、有哪些数据采集�?、当前问题状态如何？

有了这些，我们可以具体讨论，该如何建模�?

现状描述模型

当单个指标不能全面描述现状的时候，就得一系列指标有逻辑地呈现，以全面描述现状、发现问题，这是所谓：现状描述模型。业务常见逻辑�?2 种：串联式、并联式�? 串联式模型用于描述一个前后分 n 个阶段的流程，需要完成一步再到下一步。从流程起点开始，到终点结束；

并联式模型描述一个任务分开同时由各个线独立完成。从总目标开始，到执行任务的最小单位结束（如下图）�?

一般实体企业分布各地的销售是独立运作的，因此实体企业用并行方式构建模型比较多。类似的还有销售团队，话务小组，各独立运营产品线等

B 2 C 线上零售

B 2 B 跟单

一般互联网业务的转化路径更长，因此需要串联结构，看每一步的数量，向下一级的转化率。注意：主要流程长，都有这种转化路径。比�?B 2 B 业务

因此梳理业务流程的时候，需要关注业务上下游部门、兄弟部门是如何协同的，从而构建出来。实际业务流程，可能既有串联，又有并联，比如我们常说的杜邦分析法，就是如此（如下图）�?

现状描述型模型的最大作用是：清晰责任，暴露问题。因为一般各个子部门，上下游部门各有自己�?KPI，因此监控进度、复盘成果的时候，哪个环节掉链子一清二楚�? 所以在销售管理、运营管理中用得特别多。但注意：现�? \(\equiv / =\) 问题，现�? \(^+\) 标准 \(\equiv\) 问题。因此只有标准单一且明确的时候才能直接看出问题来。如果标准本身很复杂，则需要更进一步的

手段�? # 问题分类模型

如果判断一个指标好坏的标准只有一个，比如成本、利润，这时候是不需要模型的。大家都知道成本越低越好，利润越高越好，业务完全可以直接给判断标准�? 如果判断业务好坏需�?2 个标准，且这两个标准相关度低，这时候可以用矩阵模型来进行分类。常见的重要紧急矩阵，波士顿矩阵，质量/数量矩阵，都是这个原理（如下图）�?

矩阵法最大的好处，就是含义直接，很容易找到直观的业务含义，便于业务理解。划分矩阵不见得用两个维度的平均值，也能用中位数、众数等等，方便即可。矩阵本身为的是直观暴露问题。如果构造矩阵的两个维度相关性太高，则所有点都会出现�?45 度斜线上，这时候矩阵失去判断力。所以尽量选不相关的两个维度的矩阵�? 如果判断标准增加�?3 个以上，判断标准相互交叉情况太多太多，再用肉眼观察就很难判断谁好谁坏，这时候可以用 DEA 方法或�?AHP 来判断，相比之纯机器学习方法，DEA 方法含义更简单直接，AHP 方法有专家参与，都更容易被业务接受�?

评价方法	方法分类	过程概述	优点	缺点
专家权重	主观评估	开专家会，直接给各个指标权�?/td>	有专家参与，直观体现领导意志	波动大，不稳定，最后变成等老板批示
AHP	主观评估	开专家会，给各个指标两两相对重要性，再计�?/td>	有专家参�?科学计算，结果稳�?/td>	老板意志不能直接体现，可能被老板挑战
DEA	客观评估	给出投入、产出指标，直接用线性规划计�?/td>	含义直接（投入产出比），需要变量少，一定能出结�?/td>	给出的是一群对象比较的相对效率，有可能出“窝子里挑将军”问�?/td>
神经网络	客观评估	标识：好/坏结果，直接训练模型，利用模型判断新样本好坏	专业度高，能考虑大量参数	过程完全黑箱，老板难理解，容易被怼翻
只要评估指标超过 3 个，就很难平衡各方意见，强烈建议用最简单的方法：设指标主次，一个个按顺序比较，不纠结，大家都能懂！

工作计划模型

在给定业务限制条件的情况下，经常出现最优化问题。比如给定了各个部门工时成本，求一个最优任务分配。这时候就是工作计划模型。最常见的就是解线性规划，在工作调配的时候用得非常多（如下图）�? - 有两款产�?A、B 需要备货，总量 350，A 商品起订�?125，A 生产工时 2 小时/件，B 生产工时 3 小时件，A 成本 2 元，B 成本 3 元，问如何安排生产？

目标：min 2 A+3 B 由于营销/销售端可以大力出奇迹，且充满约束条件：A�?25 不确定性（不知道客户会不会响应），因此虽然理论上可以用同样方法分配任务，但实际上更倾向于投资源/打鸡血 2 A+B�?00 线性规划方法在供应链用的更多，营销/销售给到供应链的总目标是固定的，剩下的就是如何分配任务，调动产能的问�? # 未来预测模型

所有预测的基本假设，都是：未来发生的规律和过去一样，过去的场景会在未来重现。所以业务做预测的时候，常常会假设一些业务参数是固定的，然后推测未来情况�? 常见的做法，比如�? 常见的做法，比如�?、假设生命周期走势是不变的，推测未来情况 2、假设转化率/留存率是不变的，推测未来情况 3、假设投入产出比是不变的，推测未来情�?

按固定比率预�?

	T+1	T+2	T+3	T+4	T+5	T+6
DNU 1	60%	45%	35%	15%	15%
DNU 2	58%	44%	33%	15%
DNU 3	57%	43%	34%
DNU 4	61%	46%
DNU 5	59%
DNU 6

比如商品上市上线，都有明显的引入- 上升- 稳定- 衰退过程，往往在预测时先评级，根据商品性能、价位、市场推广力度，评为 ABC 级的某一个，然后直接套这个级别的走势做预测。某些生命周期明显的 APP（比如游戏）也能这么简单预�? 比如左图，在 T+4 以后，新用户当期活跃率稳定在 15%，此�?DAU 6=DNU 6+DNU 1+15%+DNU 2+15%+DNU 3+15%+DNU 4+34%+DNU 5+45%留存率稳定的情况下，就能沿着趋势继续推，模拟活跃用户走势，从而推算留存率�? 在一些发展稳定的行业里，这些假设常常很准。但注意，有三种情况下假设可能失效�? 1、新业务、新场景导致无历史数据可参照�?、突发且情况不明，导致所有转化率都异常�?、业务运作出现明显问题，已无法按正常走势反推�? 这时候要么更换预测方法，要么做足预案，提前准备后路。单纯指望预�?100 准，不论是业务模型还是算法模型，都会出问题�? 06

什么时候用算法模型

看完以上，有同学会好奇：看起来业务模型能做很多事啊，那什么时候用算法模型呢？注意：算法模型本身的强项，就不是解决经营问题。算法模型的强项是图像识别、语义识别、复杂场景下动态规划。这些才是算法该发挥用处的地方�? 就拿推荐算法举例�? 1、商品有固定的搭配。比如治疗感冒就�?VC+银翘，这叫：固定业务逻辑，这时候是不需要算法来推荐的，直接按业务逻辑走就好了�? 2、商品无固定搭配，但业务方想推。比如保健品利润高，无论如何业务方都想推保健品，这叫：强业务关联。这时候也不需要算法来推荐，而是业务方得创造话术、广告、卖点、销售技巧，千方百计地去洗脑，特别是针对大爷大妈洗脑�? 3、商品无固定搭配，且业务方无明确目标。比如天猫淘宝抖音这种，SKU 数以亿计，这时候业务逻辑完全理不清，就可以上推荐算法，而且推荐算法目标常常�?GMV 最大，用户活跃时长最长一类�? 类似地，找算法模型的应用场景，得主动回避开固定业务逻辑、强业务关联——找那些业务不知道、不清楚情况、无力加以控制的场景�? 比如�? 1、全新业务上线，谁都说不准，没经验参�?2、预测整体走势，不考虑细节，先看基本面

3、业务无计可施，怎么做响应率就是上不�?4、考虑变量太多，用肉眼人手难以分类清楚

这时候可以大胆让业务逻辑退居二线，尝试用算法解决问题。可以名正言顺地跟业务说：这就是个黑箱。我们观察结果就好了——反正他们也没更好的办法，如果能做出成绩来，就是大功一件�? 当然，以上和我们今天的话题没关系。大家先学会如何在业务参与的情况下工作。如果有兴趣看算法模型在商业问题上如何发挥作用，本篇集齐 60 在看，我们下一篇分享。敬请期待哦�