分析思维:数据分析中的4种原因


关于表面原因和根本原因的定义一直含混不清,经常有人问我究竟什么叫表面原因,什么叫根本原因,但我也一直很难给出一个明确的答案。

最近在学习逻辑学,发现有个概念可以尝试着把这个问题说清楚。

四因论

 

 
这个概念就是四因论。
四因论是亚里士多德提出的概念,他认为世界的运动变化应该来源于四类因素的影响,分别是形式因、质料因、动力因、目的因,它们的含义是:
  • 形式因:是指这件事物,它和别的事物之间的本质区别是什么
  • 质料因:是指这件事物的组成成分是哪些
  • 动力因:是指有哪些动力使他使这件事物形成
  • 目的因:是指由哪些目的促使动力存在
 
客观事物
举个例子,我面前有一张桌子。
形式因:为什么说它是一张“桌子”呢?因为它具有桌子的性质,比如我们可以在它的台面上写字看书。
质料因:这张桌子是由哪些东西组合在一起?是一些木头,金属钉等等。
动力因:木头、金属钉这些材料不会自发地组织在一起,需要有一个外部动力。那么桌子因为什么被组合起来了呢?是因为有一个工匠按照图纸把这张桌子做出来了,这个工人就是这个桌子的动力因。在动力因的部分还有主要和次要原因,比如这位工匠是主要的动力因。而工人使用的榔头锯子等工具,是次要的动力因。
目的因:这个工匠不会无缘无故有动力去打造一张桌子,一定有一个目的驱使工匠产生这样的动力。可能做桌子是这位工匠的工作,拿到报酬是他的目的。 
 
虚拟概念
上面是一个现实事物的分析,接下来看一下虚拟的概念。
比如数学公式,虚拟概念也可以用
  • 形式因是关于某个特定的数学问题。
  • 质料因是数学符号,基础的数学定理等。
  • 动力因是某个数学家,动力因中的工具因是计算机或者草稿纸。
  • 目的因是想要解决某个数学问题。
你看四因论同样是适用的。
 
主观感受
似乎虚拟概念也可以,那主观感受呢?
 
比如说,这个桌子很好看。
“好看”是个主观感受,似乎很难拆解出四因。
怎么办呢?
 
解决的方法是把主观感受转化成对应的客观事物。比如这个桌子很“好看”,可以转变成这个桌子的“美”。
美是一个名词,拆解四因就相对容易得多。
这里就不展开了,你可以尝试着自己分析下四因。
 
分析的顺序
 
四因论给我们提供了一个分析事物产生因素的四个不同角度,是一个非常强大的思维工具。
但目前还仅仅只是思维工具,还无法成为普适性的分析方法。
 
我查阅了很多关于四因论的文章,发现这几个因素的关系是并列的,没有什么先后和优先级的关系。如果是并列的,那么我们分析一个问题就要把四个因素全部分析一遍。这不符合我们平时分析问题的时效需求。
要想把四因论武装到数据分析思维中,就要搞清楚四因论分析的顺序。
 
 
我梳理了一下常见的数据分析问题,斗胆列举了一个优先级顺序。他们分别是:
  • 形式因
  • 质料因
  • 动力因
  • 目的因
 
我们来看一个例子。
 

 

分析案例
我们拿数据分析经典面试题来看看四因论的应用。
经典面试题:“gmv下降了,怎么分析原因?”
 
形式因
首先是形式因的分析,也就是搞清楚我们要分析的到底是个什么问题。
问题是gmv下降,那么这个gmv的口径是什么?什么时间段下降?是快速下降还是缓慢下降?
在确认问题的时候,我们有时就能找出问题的原因。
形式因的梳理帮助我们明确问题,搞清问题的定义。有时候搞清问题定义本身就能解决问题。
比如A行业类目的GMV下降,通过分析发现是因为A行业的定义发生了变化。A行业中的一个类目被划分到其他行业下,现在看到的GMV和之前的GMV已经不是同一回事了,他们的形式因是不同的。
 
 质料因
接下去是质料因的分析。
一张桌子要拆解质料因,我们可以按照功能拆解除桌板、桌脚等部件,也可以按照原料拆解出木材、铁钉等材料,拆解的方式是多种多样的。
分析问题时,我们同样有多种角度。GMV我们可以按照用户群体拆分,也可以按照产品维度拆分,还可以按照地域拆分等等。这其实就是我们平时说的维度拆解。
通过拆解不同维度,发现问题集中在某个维度,这就是质料因的分析结果。比如GMV下降,通过质料因的分析发现是A产品的GMV下降导致的,那么A产品GMV下降就是总GMV下降的原因。
 
我们日常做得最多的分析是质料因分析,这类分析得出的结论就是问题的表面原因。
要想进一步分析,就要挖掘动力因。
 
动力因
gmv的动力因就是各种驱动用户购买的因素。比如之前质料因的分析发现gmv下降是因为某类人群的下降,那么动力因是哪些驱动这类用户购买的因素改变了。这时我们可以用结构化思维的方法,通过拆解内部,外部等不同维度,找出动力因。比如;
  • 内部因素可能有:
    • 营销:停止了对某类人群的营销投放
    • 产品:页面改版不便于老年人使用
    • 获客:获客渠道变化导致用户群体变化
  • 外部因素可能有:
    • 负面舆情:在某年轻人社区内出现公司负面舆情。
    • 竞品动作:竞品对特定人群开展营销活动
       
如果分析出的质料因是a产品的gmv下降,那么动力因是哪些驱动用户购买a产品的因素改变了。依然采用结构化思维的方式进行拆解。
  • 内部原因可能有:a产品的产品详情页出现了调整。或者价格变动。
  • 外部原因可能有:竞品促销活动影响,产品负面舆情等。
 
目的因
最后一步是目的因。
如果不是动力因的问题,那么可能是目的因的问题。这句话用人话翻译过来就是,用户不买你的产品了,不是因为他觉得你的产品不好,而是他已经不需要了。
这种情况对一个大体量的业务来说不太常见,因为人的需求基本是稳定的,即使某些人没有这些需求,会有新的人顶上来。比如母婴类产品,对一个具体的人来说,一辈子可能也就那么3年时间需要用到,3年之后这类需求就不存在了。但是全国永远有新的产妇,所以母婴类需求会基本维持稳定。所以目的因的分析比较少见。
 
目的因的改变一般有两类,一类是特殊事件,一类是政策法规。
特殊事件:比如疫情期间,旅游订单骤降。不是因为景点不好玩了,也不是其他景点抢了你的生意,而是大家出门旅游这个需求不存在了。
政策法规:2020年国家取消了一批职业资格证,对应的教材和培训也就消失了。这也是因为目的因变化导致的。
 
至此,我们按照形式因,质料因,动力因,目的因的顺序把一个常见业务问题分析了一遍。按照这个步骤分析,每一步要解决的问题更清晰,也更容易把一个问题分析透彻。
 
总结

 

 
最后小结一下。
四因论并不是完美的逻辑工具,亚里士多德后来也修改完善四因论形成形质论,但本文也不是为了找到一个万能公式套用在所有的问题上,而是希望将四因论的思想引入到数据分析当中,让你对一个数据分析问题有更深入的理解。
最后,数据分析越到后面,哲学思辨能力的重要性就越强。想要提高分析能力的同学,建议学一些哲学和逻辑,这是比工具和技能更重要的内功。


欢迎加入CPDA,系统提升数据分析思维!