数据分析师就业前景如何?


几年大数据热席卷了整个世界,市场上与大数据相关的岗位招聘、培训数不胜数。很多人前赴后继,想要参与到这波红利当中。
 

一、提出问题

相比于大数据算法工程师入门门槛相对更大,数据分析相关岗位可以说是入门相对更低。况且,学好数据分析也会对我们日常生活决策起到帮助作用。我们都知道数据分析这类岗位就业前景好。但这只是个笼统概念,究竟如何还得具体分析。因此,我们先提出以下几个问题,带着问题去找答案。

1、 数据分析在哪些城市招聘更热门?

2、 数据分析的薪资待遇如何?

3、 各领域的数据分析岗位比较?

 

二、理解数据

所谓“巧妇难为无米之炊”,提出了问题却没有数据,该怎么分析呢?此时,我们可以借助工具爬取数据。在拉勾网爬取数据分析招聘数据,由于拉勾网设置招聘页面最多显示30页额的规定,爬取1次的数据量远远不够,因此我根据数据分析的不同关键词爬取了6次数据,共有3581条数据,得到如下的的数据excel表并理解每列数据含义。

理解数据_大数据_数据分析_数据可视化_数据清洗

三、数据清洗

具体操作步骤:

1、隐藏掉一些不需要的列,重新给各列命名,将6张表格合并为1张excel表格。

2、以所有列名结合在一起为条件,删除1281条重复项,保留2299条数据。检查每一列并删除空白值,最后剩下2297条数据。

3、将“城市”列分列,只保留城市名称;

4、将“月薪工作时限学历”列分成3列,分别为“月薪”、“经验要求”、“学历要求”。由于爬取数据时,网页限制,导致“月薪工作时限学历”列中月薪与经验年限之间存在25个空格,并且存在换行现象。使用Substitute函数2次,消除单元格内的空格并消除换行带来的影响。

5、将“公司情况”列分成4列,分别为“公司所在领域”、“公司所在领域”、“公司融资情况”、“公司规模”。最后结果如下图所示。

_大数据_数据分析_数据可视化_数据清洗

6、处理“月薪”列,将该列扩展出“最低薪资”、“最高薪资”、“平均薪资”列。其中使用的函数有FIND()、Left()、Mid()、Len()、Average()函数。并且使用帅选功能筛选出“#VALUE!”错误值并处理。

数据分析师就业_大数据_数据分析_数据可视化_数据清洗

7、将“平均薪资”列进行降序排列并扩展至其他列。

数据分析师就业_大数据_数据分析_数据可视化_数据清洗

8、借助数据透视表进行异常值处理。

数据透视表_数据分析师就业_大数据_数据分析_数据可视化_数据清洗

我们发现透视表行标签里存在“大数据工程师”等这类不属于数据分析的职位,这就属于异常值,我们需要想办法将其去掉。“职位名称”列中存在“数据分析”、“数据运营”、“分析师”、“数据专员”关键词的就属于数据分析岗位。使用FIND()、COUNT()、IF()函数筛选并标记出来。

大数据工程师数据分析师就业_大数据_数据分析_数据可视化_数据清洗

至此,数据清洗工作就算结束了。然后开始使用数据透视表进行分组分析。

 

四、数据分析

数据清洗完的数据重新复制粘贴到新的工作表,然后使用数据透视表进行分析。
数据分析师_数据分析师就业_大数据_数据分析_数据可视化_数据清洗

数据分析师就业_大数据_数据分析_数据可视化_数据清洗

 

通过上面两张图可知,北京、上海、杭州、深圳、广州招聘数据分析相关岗位较多,其次武汉、南京、长沙、成都、苏州、西安、郑州位于第二梯队。大家找工作可以把目光瞄准这些城市。另外,对于工作经验,基本上城市都会倾向对工作经验为1-3年和3-5年的需求量更大。

数据分析师就业_大数据_数据分析_数据可视化_数据清洗

从上图得知,各城市平均薪资,一线城市是最高的。其次,杭州、无锡、珠海、宁波、苏州这些二三线沿海一带的城市平均薪资水平也较高。

数据分析师就业_大数据_数据分析_数据可视化_数据清洗

从上图看出,互联网金融、O2O、数据服务、教育、电子商务、文化娱乐领域对数据分析需求量相比其他行业更大。想要转行的朋友人可以多了解下这些行业,转行成功的几率更大。
来源:中国统计网
CPDA数据分析师海报