3.3 不预设立场,通过客观的标准代替主观的判断
客观地给出评价标准是数据分析师的主要职责之一,因此数据分析师不可预设立场,必须用数据说话,通过数据找出业务波动的真实原因。不预设立场,建立客观准确的评价标准也是数据思维培养过程中的重要一环。
3.3.1 不预设立场才能做到客观
数据部门通常独立于业务部门,因此数据分析师可以站在更加客观的角度评价业务现状。在大部分情况下,如果业务出现问题,业务方往往会站在自己的立场上,认为这个问题和自己没有关系。当业务指标出现波动,站在业务方的立场,其大概率认为这件事情是数据传输、行业因素、用户质量等多方面原因造成的。这个时候数据分析师就需要用客观的标准代替主观的判断,通过数据告诉业务方到底是哪个环节出现问题导致业务发生波动。
举个例子来说,某款产品在全球很多地区都已上线,在一段时间内某个区域的新用户留存率降低将近5%,运营方觉得问题很严重,但是其觉得近期运营活动做得很成功,造成留存率降低的原因可能是数据缺漏或者近期用户质量不佳等。于是,运营部门拉上了数据部门、市场部门、运维部门召开多方会谈,探讨新用户留存率下降的原因。如图3-5所示,面对这样的场景,数据分析师需要站在数据的角度看待问题,不预设立场,通过将现有数据与特定的标准进行比较,排查业务是否存在问题,进而定位引起业务波动的具体原因。
图3-5 数据分析师排查业务问题的步骤
面对这个问题,数据分析师首先要找到一个标准,判断是否新用户留存率真的下降5%。这个标准可以和该地区前一段时间的新用户留存率进行对比。其次,在一般情况下,数据分析师需要排查数据传输问题,以明确是否是数据缺失造成数据指标波动的。但在此情景中,全球多个区域中只有一个区域用户留存率下降,大概率不是数据传输造成数据缺失。另外,数据分析师还需要查看新用户留存率下降是持续走低还是周期性走低。如果是周期性走低,留存率降低可能就是一个周期性波动的现象;如果是持续走低,就需要数据分析师继续拆解数据指标,以找出数据异动的原因。最终,数据分析师确定新用户流失率的确存在持续走低的情况,并发现这是由该地区网络供应环境较差引起的。与此同时,运维团队也在其数据监控中发现该地区网络存在波动情况,为数据分析师的结论提供了佐证。
上述例子是数据分析师不预设立场,得出客观结论的过程,以客观的标准代替主观的判断可减少不同部门之间的沟通成本,快速确定数据异动原因。
3.3.2 预设立场与假设检验的区别
在数据分析过程中,数据分析师经常会用到假设检验的分析方法。这时候大家可能就会有这样的疑问,假设检验是否等同于预设立场?答案是否定的。图3-6展示了预设立场与假设检验的区别。
图3-6 假设检验与预设立场的区别
预设立场是通过数据证明自己的猜想是正确的,一个数据不行,更换思路用另一个数据,直到找到能够证明猜想的数据为止;假设检验是先提出一个假设,通过收集证据去验证假设是否正确,如果有足够证据证明假设是正确的,则接受假设,否则拒绝假设。
想要证明一个猜想是正确的,总会找到不同的方法。如果数据分析师预设立场,就会通过不同的数据维度去证明一个猜想是正确的,而不是客观地评价该事件。所以不预设立场,用假设检验的方法验证各类猜想,用客观的标准代替主观的评价是数据思维培养过程中重要的原则之一。