在依靠数据驱动的商业世界中,数据分析已经是 IT 互联网、咨询、广告等行业从业者必备的职业技能。而随着大数据时代的到来,如今90%的企业都想利用数据分析为其带来更便利的服务,数据分析师这类人才可谓供不应求。
那么如何成为一名合格的数据分析师?首先先来了解一下数据分析师的发展阶段。
1、数据专员
此时的数据分析师就是给领导或者同事导出产品运营的数据报表,整合下出个报告。统计学知识基本用不上,因为领导和同事也看不懂,他们只需要某个数据能够反馈出产品改进、运营的效果即可,所以这类数据分析师的工作比较机械,但是对于自己所在的行业产品还是很熟悉的。
这个阶段必须学会SQL,熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果就没有太大的使用价值。
数据库对初级的小白来说还没有入职前可以学习MySQL,入职后如果不一样就看公司用什么,你就学什么。
此阶段的分析师熟练掌握了数据库与统计学,统计学主要学会主成分分析、假设检验、描述性统计、贝叶斯、回归、广义线性回归这几个概念,也可根据自己想去的行业选择性学习,比如时间序列、非参之类以及线性代数等学习方向。
4、前景选择
最后一个阶段就是自我裂变、向上生长的过程。
当你的基地打造牢固以后,就可以建高楼了。这时有很多方向可以供你选择,数据分析师可选择的方向:
数据分析师(数据科学家)、BI、ETL工程师、大数据工程师、数据工程师、数据挖掘、爬虫工程师、可视化工程师
精进统计学,熟悉业务,机器学习会使用(调参+选模型+优化),取数、ETL、可视化等等基本都懂的就是数据科学家。当然这个阶段工具的使用也不容忽视。
数据分析流程
作为数据分析师,无论最初的职业定位方向是技术还是业务,最终发到一定阶段后都会承担数据管理的角色。因此,一个具有较高层次的数据分析师需要具备完整的知识结构。大数据时代,数据分析对于企业决策和发展起到越来越重要的作用。
1、明确目的和思路
梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标(各类分析指标需合理搭配使用)。同时,确保分析框架的体系化和逻辑性。
2、数据采集
了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。这会帮助数据分析师更有针对性的控制数据生产和采集过程,避免由于违反数据采集规则导致的数据问题;同时,对数据采集逻辑的认识增加了数据分析师对数据的理解程度,尤其是数据中的异常变化。
在数据采集阶段,数据分析师需要更多的了解数据生产和采集过程中的异常情况,如此才能更好的追本溯源。另外,这也能很大程度上避免“垃圾数据进导致垃圾数据出”的问题。
3、数据分析
数据分析相对于数据挖掘更多的是偏向业务应用和解读,当数据挖掘算法得出结论后,如何解释算法在结果、可信度、显著程度等方面对于业务的实际意义,如何将挖掘结果反馈到业务操作过程中便于业务理解和实施是关键。
常用的数据分析工具,掌握Excel的数据透视表,就能解决大多数的问题。需要的话,可以再有针对性的学习SPSS、SAS等。
数据挖掘是一种高级的数据分析方法,侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
4、数据可视化
一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
当前我国数据分析师由中国商业联合会数据分析专业委员会以及工信部教育考试中心共同考核认证,通过培训考核,工信部教育考试中心颁发《数据分析师职业技术证书》,数据分析行业协会颁发《数据分析师证书》,此证书是申请成立数据分析事务所的必备条件之一。