如何成为一名更有 “市场” 的数据科学家?


这个标题可能有点奇怪,毕竟在 2019 年,数据科学家本身就已经是一个非常有市场的职业了。由于数据科学对当今的业务产生了巨大影响,因此对数据科学专家的需求正在增长。截至本文发布之前,仅 LinkedIn 就有 144,527 个数据科学工作。

但是,更重要的是要密切关注行业脉搏,了解最快、最有效的数据科学解决方案。为了帮助大家,痴迷于数据的 CV Compiler 团队分析了一些职位空缺数量并确定了 2019 年数据科学领域的就业趋势。
 

2019 年更受欢迎的数据科学技能

下图显示了 2019 年雇主需要数据科学工程师能够掌握的技能:

2019 年更受欢迎的数据科学技能

在此分析中,该团队查看了来自 StackOverflow,AngelList 和类似网站的 300 个 Data Science 职位空缺。某些条款可能在一个职位列表中重复多次。

注意: 这项研究代表了雇主的偏好,而不是数据科学工程师自己。
 

关键要点和数据科学趋势

显然,数据科学更多地是在于基础知识而不是框架和库,但仍有一些趋势和技术值得注意。
 

大数据

根据 2018 年大数据分析市场研究,企业的大数据采用率从 2015 年的 17% 飙升至 2018 年的 59%。因此,大数据工具的普及也在增长。如果不考虑 Apache Spark 和 Hadoop 的话,最受欢迎的是 MapReduce (36) 和 Redshift (29)。
 

Hadoop

尽管 Spark 和云存储很受欢迎, 但 Hadoop 的时代还没有结束。因此,一些雇主仍然希望候选人熟悉 Apache Pig (30),HBase (32) 和类似技术。 HDFS (20) 也在调查中被提及。
 

实时数据处理

随着各种传感器、移动设备和物联网 (18) 的应用越来越多 ,越来越多的企业的目标是从实时数据处理中获得更多的见解。因此,像 Apache Flink (21) 这样的流分析平台在一些雇主中很受欢迎。
如何成为一名更有 “市场” 的数据科学家?


特征工程和超参数调整

准备数据和选择模型参数是任何数据科学家工作的关键部分。数据挖掘 (128) 这一术语在雇主中颇为流行。一些雇主也非常重视超参数调整 (21)。但是作为数据科学家,您首先需要关注特征工程。为模型选择最佳功能至关重要,因为它们决定了模型在其创建的最早阶段的成功。
 

数据可视化

处理数据并从中提取有价值的见解的能力至关重要。不过,数据可视化 (55) 对于任何数据科学家而言也同样重要。其核心目的是,您可以以任何团队成员或客户都能理解的格式展示您的工作成果。至于数据可视化工具,雇主更喜欢 Tableau (54)。
 

一般趋势

在该项调查中,AWS (86)、Docker (36) 和 Kubernetes (24) 这样的术语也多此出现 。因此,软件开发行业的一般趋势也适用于数据科学领域。

数据科学是一个快速发展和复杂的行业,其中一般知识以及特定技术的经验都很重要。希望这篇文章可以帮助您获得有关 2019 年所需的数据科学技能的宝贵见解。
CPDA课程海报