2022- 08- 09 11:25

近两年来,数字化、数据分析、大数据等概念火了,引来一帮牛鬼蛇神,把各种各样乌七八糟的东西都包装成“大数据思维”兜售。总结一下,一共八大门派,各个身怀绝技。在工作中遇到了,绝对让人苦不堪言�? # 门派一:“数据在手,天下我有”派

这个派系的口头禅是:“只要拥有了大数据,就能精准预测,千人千面,大幅度拉升收入!�? 听着振奋人心吧!可实际上,大数据不能帮你做到这些!用户最终买单,是因为有好的商品、便宜的价格、吸引人的设计、恰好在需要的时候看到广告等等,从来都不是因为有什么大数据。数据的作用,是在商品、价格、设计、投放的基础上做优化(如下图)�?

数据的作用类似导�? 1. 它可以指示你在哪里(日周月报�? 2. 它可以指示有几条路走(经验复盘)
3. 它可以监督路上堵不堵(数据监控)
4. 它可以预测到达时间(预测分析�? 5. 堵车的时候可以提示原因(问题分析�? 6. 堵车的时候可以指示其他路(aBtest�? 但有两样是一定替代不了的

  1. 你得告诉他你要去哪里(设定目标)

  2. 你得有个车,才能跑(业务才是骨干�? 没车的话,光有导航,就只能用脚板走�? 另:导航需要提前准备大量地图信�? 正如数据需要大量数据采集一样,

这一派的危害在于:对数据能力有不切实际幻想。比如把增长的运气都赌在一个神乎其技的数据分析师身上,最后肯定是乘兴而来败兴而归�? # 门派二:“关我啥事”派

这个派系的口头禅是:“我们要建立全链路数据模型,收集:用户信息、用户爱好、用户意向、用户情绪、用户行为、用户评价、实现全方位分析。�? 听着很厉害是吧?你问他一句:“等会!这些数据你打算咋收集呀?�? 他就会回答:“数据采集关我啥事!不是有开发吗!我聚焦思维就好了……�? 数据思维之所以不是吹牛逼思维,就是因为它以数据为基础。而数据是需要采集的。并且,不同类数据采集的难度、成本、采集质量,相差甚远(如下图)�?

这一派流毒也很广,特别在非技术出身的人群里,这帮人以为数据是天上掉下来的。导致的恶果,是“业务一张嘴,技术跑断腿”,回头他还怪你:“人家头腾阿就有,你没有是你没本事……�?

门派三:“SWOT”派

这一派是“关我啥事派”的另一幅面孔,就是喜欢扯非算法类的思维模型。尤其以什�?SWOT、PEST 为甚�? 大部分思维模型,真的只�?ppt 里四个格子,根本没法量化,跟数据思维一毛钱关系都没有�? 但是,很多领导是 SWOT 派的信徒,并且尤其爱在汇�?ppt 里看到这种东西。所以一般面对这种领导,我们不会选择怼回去,而是用科学、复杂的方式,量化这种“模型”(如下图)�?

门派四:“十大法则”派

从这一派开始,后边几个门派都开始讲数据了!这是个重大进步。但嘴巴上挂俩数字,并不代表就是数据思维。典型的一类错误,就是这个“十大法则”派。他们尤其喜欢在某个公司、某个业务、某支股票成功以后,洋洋洒洒列举一堆数据,然后总结出以下结论:

“十大成功法则�? “五大底层逻辑�? “九个关键因素�? 这一派相当唬人。一来它讲的都是成功的案例,你不能直接反驳。二来它确实列举了一堆数字,看起来好有道理哦。实际上,这是典型的事后诸葛亮行为�? 数据思维的核心是逻辑、而不是数字有多大。逻辑是可以从旧的数据中归纳,可以用别的场景验证,可以推测到未来。没有经过检验,只看成功个案,会混淆视听(如下图)�?

站在最后一刻总结经验,是伪数据思维的典型,最后结论就是:成功的人放屁都是成功屁。避免该问题的最简单办法就是拉长时间,从发展初期开始研究,区分:哪些是行业周期性波动哪些是红利期、低谷期同时间段,他比竞争对手多做了什么这才是符合数据思维的靠谱做�? 这一派的最大危害,在于:引发盲目崇拜和瞎指挥。通俗的说:成功的人可能每天只�?4 个小时,但你每天�?4 个小时不会成功,只会累死。道理就是这么简单�? # 门派五:“朕即国家”派

这一派在业务部门尤其多,特别喜欢讲数据:

“这个业务,活跃率必须做�? 30% 以上”“我们的服务,要�?1 分钟以内响应客户”“今年的目标,要做到 1 个亿,才能实现腾飞�? 并且标榜以上东西为:大数据思维,还尤其爱说:“这是朕在行业内沉淀十年的内功心法�? 然后你问他:为什么是 30% ,不�? 20%

为什么是 1 分钟,不�?30 秒为什么是 1 个亿�?.5 亿又怎样

他就回答�? “朕从业十年,数字就该是这样�? “朕认识好多人,他们也认为这样�? “朕是这个行业内专家,谁不认同我谁是傻逼�? 这根本不是数据思维,恰恰相反,这是反数据思维的经验主义。真正的数据思维,给出标准是有逻辑、可验证的,绝不是什么“老子从业十年……”(如下图)�?
�?1:活跃率与付费率关系


�?2:活跃率与付费的关系(多种可能性)

论证一个指标合理性的简单办法,就是看该指标数值与其他关键指标关系。如上图 1:当用户群体活跃率提升到 50%以上的时候,付费率有明显跃升。此时可以说 50%是个关键分界点。当然,实际情况可能很复制,比如�?2,有的是特定区间的关系,有的是临界值关系,有的是线性关系,有的是指数型关系。经验可能告诉你一个数值,但数据分析能发现更多可能性�? 这一派人在工作中引发的乱子尤其多!大部分经验主义者,并没有真正验证过自己的认知,经常在愿景中盲目自大,仗着经验乱怼人;在逆境中胡乱甩锅,自己前后言行不一,还恬不知耻,反正只要是他说的,就是对的�? 这一派是“朕即国家”的另一幅面孔。他们也很喜欢标榜自己“精通数据思维”,然后讲的案例,都是:

“我看到街上�?10 张广告牌,转念一想,这要是打上广告,得赚多少钱�? “我看到销售们每人�?100 张名牌,转念一想,这要是打上广告,又是多少钱�? “我看到车厢里十个人有八个在看手机,转念一想,这要是……�? 这根本不是数据思维,因为你会发现:拿掉里边的数字,这些故事照样成立。真正的数据思维,是把决策建立在数据的基础上,根据数据差异做判断(如下图)�?

这一派的毒害,在于用无聊的数字,掩盖了真正要分析的问题。最后出了问题,他还会倒打一耙:“都是数据分析不深入,才让我决策失误的呀。�? 这一派牛逼了,张口《机器学习》,闭口《统计学习》,总之非模型不数据。常见于刚毕业的,做技术的新人�? 算法不是数据思维的全部。实际上,正如算法叫“算”法,本质上它就是个计算公式而已(如下图)�?

模型本身并不神奇,它只是用一系列数学/统计方法,去模拟出一条计算公式而已,如左图,就是用各种函数,模拟一条曲线,表示用户量随时间变化的趋势�? 至于为什么是这个走势,制造这个走势需要什么样大环境,需要什么样资源投入,业务方要怎么做,模型解答不了!它只负责根据过去的走势算一个数,仅而接地学梦堂

现实问题非常复杂,需要转化以后才能用对应方法解决。比如预测销量问题,可以用时间序列预测,也能用两阶段预测,也能用回归预测。遇到问题,第一时间应该是理解业务目标,然后找合适的方法,转化为分析问题,而不是去搬书�? 这一派的毒害,在于用:常常用看似科学的方式,行不懂脑子的事实。最常见的,就是胡乱塞几个指标进回归模型,然后说:就是这个因素影响业绩,因为 R 平方的值是 0.99 呀!结果自然被人怼的体无完肤�? # 门派八:“假设检验”派

这一派是“算法模型”派在业务部门的代表。近两年来,在产品领域尤甚�? 很多产品经理,上版本的时候,不管目标受众,不想检验指标是啥,不考虑影响因素,不理强相关特征,不理会抽样框设计,不管控制变量……总之瞎几把做两个版本丢上�?ABtest�? 然后逼着数据分析师用各种统计量论证结果到底有没有差异�? 这就打着科学旗号反科学。最后经常沦为:逼着数据分析师用科学方法证明一个拍脑袋的结论�? # 小结

以上八大门派,本质上违反了数据思维所要求的“从事实出发,先收集数据,再通过逻辑论证”的思路,把数据思维简单等同于几个数字,几个玄幻的概念,几个教条公式�? 并且试图拿着这些来路不明的数字与书本上公式解决现实问题。可能有同学会好奇:真正的数据思维是啥样的�