面对突发风险,数据分析师能做什么?
- 2020 年 3 月 4 日
- 筆記
2020年的春节,陈老师和所有同学们都经历了超级大突发风险。相信过去的一个月,很多人都已经宅到怀疑人生了。面对突发的疫情,相信很多同学的第一反应都是:早点知道就好了!如果能早点知道,不说能力挽狂澜扭转局势,起码自己也屯点口罩酒精干粮电视剧什么的。
是滴,面对突发风险,所有人的第一反应就是:我要是能未仆先知就好了。你会发现几千年来,历朝历代,世界各地的人们,都对未仆先知充满期待。不变的是诉求,变化的,只是具体的工具,比如水晶球、魔镜、瓶子里的精灵、河里的神仙、童颜鹤法的老者、神秘兮兮的孩童。当社会进步到了数字时代,当然大家期望的是“大数据人工智能”。
“要是大数据人工智能能精准预测未来就好了!”
人人都这么期望,But,真的搞得掂吗?
1
识别风险的类型
至少在本次新冠疫情中,大数据人工智能在精准预测上没起到啥用处。事前,没人能预测得到疫情发生;开始阶段,基于sars数据的模型预测值全部偏小;在发展过程中,在恐惧支配下所有模型都预测过大;而现在,国内已经得到一些控制,国外又开始肆虐。在2月26号的新闻发布会上,钟老爷子把形势改善总结为:强力的管控措施+人人自觉参与。总之,在预测这个点上,是没大数据啥事了。
但注意,新冠这种风险有两个特点:
- 突发性危机:这玩意发生突然,扩散很快。
- 我们完全不了解他:这玩意和sars并不一样,我们花了nnn久都没完全弄清楚它的情况。
这种情况本身是很难预测。用数据预测的基本原理,是过去的规律未来会重现。无论是业务分析还是建模,都依赖已有数据/经验(如下图)如果现在发生的根本没有东西可以参照,比如这次新冠,我们就只能摸着石头过河,逐步探索方法。
但注意,并非所有风险,都是突发危机,都是不为我们熟知。所谓突发风险,其实和两个维度有关:问题突发性+我们认知程度。在数据分析方法中,两维度的分类可以用矩阵法,做一个如下分类。分完类你会发现,大部分“风险”根本不需要水晶球来预测,也能应对。
2
这种风险,不需要水晶球来应对
首先,最不需要水晶球也能应对的风险,就是“日常+知道”类,俗称“作死类”风险。很多同学好奇,说日常又知道,还能出意外?大家看看下图的场景,是不是很常见呀。生活中这种作死的事多了去了。
在企业中这种事情更屡见不鲜:
- 生产:有运作规范不遵守,“赶时间,顾不上;规矩多,懒得弄”
- 运营:明知方案有漏洞还是照做,“薅点羊毛没什么,都是增加DAU”
- 产品:明知没测试好,还是强行上,“这是老板的命令”
总之,大多场景是明知山有虎,偏向虎山行。最后被吃了一点不奇怪。
这种问题模型根本预测不了,也不需要模型预测!
我们需要的是:
- 教训总结
- SOP文档
- 数据监控
- 及时纠偏
通过严格的管理,把问题消灭在萌芽状态。
3
这种风险,也不需要水晶球
“日常+不知道”的风险,也不需要水晶球。这种风险往往是无知者无畏,看似出了意外,在懂行人眼里,丫早就该死了,铁定该死了。在生活中最常见的就是仗着自己年轻力壮不爱护身子,疯狂熬夜、往死里喝酒、不健康饮食,最后嘎嘣嗝屁(如下图)
在企业里这种情况也很常见。外行指挥内行;跨行的不去研究实际,凭想象办事;追逐最新的概念不管落地效果等,都会搞出来这种无知者无畏的错误。在传统企业常常表现为盲目跟风互联网,人家做O2O他也做,人家搞中台他也搞,最后要效果没效果,算成本一大堆。在互联网企业里则是不总结经验,盲目烧钱增长,盲目招人搞新概念,最后资金烧尽,散伙走人。
然而外行领导内行这种事总是存在,业务也不可能总是原地踏步,总要步入新领域。所以讳疾忌医并不是解决问题的办法,想要应对,作为数据分析师可以:
1、总结过往经验。业务数据走势,数据基础形态,产品分类,用户结构等做好,这样为决策提供清晰的常规标杆。即使外行来领导,也能一眼看到正常的行动范围是什么,出了问题也能尽早知道。
2、有限度的创新。创新需要做,但要控制范围做,要详细地记录试点结果,把创新的破坏力控制在可控范围内。遇到有人跟你说:“我们这个点子有着无法用数据估量的,但实际长期价值达数千亿的价值”的时候,要坚决把这种人标识为“大忽悠”、“神经病”。不谈数据,扯什么价值。
4
这种风险,完全可以预测
“知道+突发”型,是完全可以预测的。在生活中最典型的就是运动损伤。虽然孤立的看一次受伤,纯粹是个意外。但综合很多次记录,综合他人记录就发现,这玩意其实有规律。本来办事情就有风险,而通过数据统计,我们可以计算出风险。
在企业这种情况也很常见。比如
- 运营做活动设计,响应率可能有高有低
- 文案做内容创作,选题可能火可能吃憋
- 商品做新品选款,有可能爆款,也有可能滞销
- 产品做功能设计,有可能提效,也有可能添乱
- ……
总之单独看个案,经营活动似乎都是意外。但分类来看,我们会发现有些问题有明显规律性。比如做促销可能就优惠券、积分、礼品、打折几种手段,每种响应率就是一个固定范围。比如用户按性别、职业、使用经历等区分下来就ABCDE五个类型,DE型违约风险就是很高。这样就能提前进行规划,在做策划、设计、准备工作的时候预计潜在情况,留下一定灾备空间,做好预案。
既然涉及分类、预测问题,就可以用模型。实际上传统商业模型大部分集中在这个领域。比如风险评估模型、响应率预测模型等等。只不过建模对数据量和数据质量要求比较高,所以一般在数据较为丰富的银行、平台型互联网公司做的多。
有同学会说,那我们数据很少咋办。用户、商品、行为的数据少,还可以从企业内控角度,从经办人的角度反推吗。比如陈老师就做过,B2B企业数据采集太少,于是我们从经办人角度来分析,发现:你把这个活交给小张,就是比交给小李成功率高20%,这样也能起到灾备作用。
5
数据分析师应对风险的工作小结
小结一下:面对风险,数据分析师可以做的是:
- 突发+不知道:密切监控问题走势,测试可行办法
- 突发+知道:归纳成功经验,预测成功几率,做好灾备准备
- 日常+不知道:归纳成功经验,进行有限度测试
- 日常+知道:归纳失败教训,监控业务走势
是滴,纵观各种场景,出现频率顺序,是:归纳≥ 测试 = 监控 ≥ 预测。预测只是一部分,且是在积累了相当数据,做了归纳以后的。比起赌一个预测结果,不如踏踏实实做好常规归纳、测试、监控工作,找到应对问题的办法。
正如同抗疫英雄,上海的张文宏所总结的:
我们的预测
如果做得不好,会有80万感染
如果做得一般,会有16万感染
现在经过这么多投入和努力,只有337例
说明我们做的还可以
数据分析师最大作用也是如此,推动业务去行动,去“做”。归纳经验、测试方法、监控走势、预测可能性,全方位地服务。利用事实说话,找到真正有用的办法,这才是最大的价值。所以看完本篇,可以转发出来给那些还在期待你造出“水晶球”的朋友们看看,所谓“大数据”“人工智能”是这样发挥作用的。真一定想造水晶球,你需要一个魔法师,不是数据分析师哈,哈哈哈。