数据科学在各行各业中的差异


一份名为《AnalyticsWeek和BusinessOver Broadway数据科学调查》的报告揭示了数据科学所扮演的角色、数据科学技能的熟练度以及项目结果满意度在各行各业的差异。信息技术行业拥有最多的数据科学家。在雇佣数据科学家最多的十大行业中,有六个行业的研究型数据科学家数量超过了其他类型的数据科学家。与其他行业的数据科学家相比,专业服务行业的数据科学家在数据科学的三大技能——商业、技术和数学/统计方面,都拥有非常高的熟练度。

数据科学在各行各业中的差异

 

各行业的数据科学家占比

图1:各行业的数据科学家占比

在我们对数据科学家的调查中,我们询问了1000多位数据科学家的个人和工作情况、他们对三项数据科学技能(商业、技术及数学/统计)的熟练程度、他们所扮演的角色(企业管理、开发人员、创意人士和研究人员)以及他们对所从事项目结果的满意度。

 

调查显示(图1),雇佣数据科学家最多的行业依次是信息技术(26%)、教育/科学(14%)、咨询(13%)、金融服务(11%)和医疗保健(9%)。

 

数据科学在各行业所扮演的角色

数据科学在各行业所扮演的不同角色

图2:数据科学在各行业所扮演的不同角色

 

接下来,我们看看数据科学家在其公司里扮演的不同角色。由于样本容量的限制,我们只列出了十个行业的调查结果(另外14个行业的样本容量低于20)。

图2显示,以研究人员为主的行业包括教育/科学(83%)、广告/媒体/娱乐(69%)、金融服务(65%)、医疗保健(61%)、咨询(61%)和政府(59%)。不出所料,开发人员是信息技术行业(57%)里最常见的数据科学家类型。企业管理人员则是零售/消费产品行业(69%)里最常见的数据科学家类型。此外,创意人士是专业服务(58%)和通信(57%)行业里最常见的数据科学家类型。

 

各行业的数据科学技能熟练度

各行业的数据科学技能熟练度差异

图3:各行业的数据科学技能熟练度差异

 

下面,看看各行业的数据科学技能熟练度(图3)。总体来看,各行业的技能熟练度特点趋于一致。在十个行业中,有九个行业的数据科学家在商业和数学/统计技能方面的熟练度超过了技术方面(教育/科学行业除外)。

 

另外,三项数据科学技能的熟练度在不同行业中存在显著的统计学差异。与其他行业相比,专业服务行业的数据科学家在所有三项数据科学技能方面,都拥有最高的熟练度。

 

教育/科学行业的数据科学家拥有最高的数学/统计技能熟练度(64),但商业技能的熟练度最低(44)。

 

教育/科学和医疗保健行业的数据科学家拥有最低的技术技能熟练度。

 

各行业的数据分析项目结果满意度

各行业的数据分析项目结果满意度

图4:各行业的数据分析项目结果满意度

 

数据分析项目结果的满意度存在显著的统计学差异(图4)。教育/科学、咨询和金融服务行业的数据科学家对项目结果的满意度最高,而政府、广告/媒体/娱乐和通信行业的数据科学家则对项目结果的满意度最低。

 

总结

调查结果显示,行业之间在以下三个方面存在差异:1. 数据科学家的工作角色;2.数据科学家对数据科学技能的熟练度;3. 对项目结果的满意度。

 

调查显示,近75%的数据科学家来自五个行业:信息技术(26%),教育/科学(14%)、咨询(13%)、金融服务(11%)和医疗保健(9%)。此外,不同行业在数据科学家类型、技能熟练度以及项目结果满意度方面,也存在差异。

 

数据科学在各行业所扮演的角色大为不同。在十个行业中,有六个行业的数据科学家以研究人员为主。在其余行业中,则以另外三个角色为主。这种差异反映了各个行业所需要数据科学家完成的工作量和工作类型的不同。例如,只有信息技术行业的数据科学家才以开发人员为主,但更注重数据分析而不是技术创新的行业(比如教育/科学和医疗保健)则以研究人员为主,而强调通过创新思维解决问题的行业(比如专业服务和通信)则以创意人士为主。

 

各行业在数据科学家的技能熟练度方面也存在差异。只有教育/科学和专业服务两个行业的数据科学家掌握足够的数学/统计技能熟练度(熟练度不低于60)。而另一方面,只有通信行业的数据科学家拥有足够的商业技能熟练度。

 

最后,各行业在数据分析项目结果的满意度方面同样存在差异。为了弄清造成这种差异的原因,我们分析了每个行业的数据科学家类型及其教育水平。先前的调查发现,这两个因素与项目结果的满意度有关:研究人员对项目结果的满意度明显高于开发人员和企业管理人员。目前这次调查显示,满意度最高的四个行业是那些至少半数受访者为研究人员的行业。然而,在满意度最低的三个行业中,有两个行业也是研究人员占比较高的行业。

 

接下来看看教育水平。我们之前发现,与学历较低(高中、专科和本科)的数据科学家相比,获得高级学位(硕士和博士)的数据科学家在很多技能方面都拥有更高的熟练度。然而,我们在分析各行业数据科学家的教育水平时,没有明确的迹象表明,满意度高的行业(教育/科学:77%的人拥有高级学位)比满意度低的行业(广告/媒体/娱乐:71%的人拥有高级学位)拥有更多的高学历数据科学家我们需要进一步的研究才能更好地理解,究竟是什么导致各行业在项目结果的满意度方面存在上述差异。

 

虽然数据科学家从事于各行各业,但他们中的很多人都来自少数几个行业。行业不同,其数据科学家的类型也不同。虽然每个行业都涵盖了数据科学家的所有四个类型,但侧重点各有不同。调查结果表明,无论身处哪一行业,数据科学家的职责在于优化数据科学的价值。更好地理解数据科学方法、实践和结果的行业性差异,有助于企业针对各自行业特点选择最合适的数据科学家,也有助于招聘人员找到最合适的数据科学家