基于大数据的战略新兴产业紧缺人才需求预测


作者:北京地区 CPDA 数据分析 李永强
2016 年 3 月中共中央发布《关于深化人才发展体制机制改 革的意见》,再次体现了习主席 “聚天下英才而用之” 的人才 发展观,提出要“创新人才教育培养模式。突出经济社会发展 需求导向,统筹产业发展和人才培养开发规划,加强产业人才 需求预测,加快培育重点行业、重要领域、战略性新兴产业人 才”,并“充分运用云计算和大数据等技术,为用人主体和人 才提供高效便捷服务”。
 

同期,教育部印发《高等职业教育创新发展行动计划 (2015-2018 年)》明确提出:推动建立行业人力资源需求预 测、就业形势分析、专业预警定期发布制度。
 

2017 年 9 月,中共中央办公厅、国务院办公厅印发《关于 深化教育体制机制改革的意见》指出 “支持行业组织推进校企 合作、发布人才需求信息”。
 

2017 年 12 月 19 日,国务院办公厅印发《关于深化产教融 合的若干意见》指出 “人才培养供给侧和产业需求侧在结构、 质量、水平上还不能完全应,“两张皮” 问题仍然存在”、 “用 10 年左右时间,教育和产业统筹融合、良性互动的发展格 局总体形成,需求导向的人才培养模式健全完善,人才教育供 给与产业需求重大结构性矛盾基本解决,职业教育、高等教育 对经济发展和产业升级的贡献显著增强”,等等。
 

从国家到地 方各级政府都相继提出产业人才需求预测和研究的课题。再加 上,最近几年来,全国各地都掀起了 “抢人” 大战,体现出各 地对产业人才的旺盛需求。因此,只有更科学、更有针对性的 对产业人才需求进行预测,才能更合理、更适应产业需求的引 进人才、培养人才,才能更好的服务产业发展。
 

与传统产业不同,战略性新兴产业具有知识密集、发展 快速、跨界融合等特点,对中高端专业技术人才的需求极为迫切,面临着专业技术人才紧缺的难题:院校人才的供给与产业实际用人需求方面存在严重的不匹配。从战略性新兴产业发 展的现实需求出发,通过编制《战略新兴产业紧缺人才需求目 录》(以后简称 “目录”),针对性地摸清产业发展所需专业 技术人才的紧缺情况。
产业需求人才供给侧现状_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析

 

图 1:产业需求人才供给侧现状
 

此外,目录对政府、企业、院校和教育机构、求职者都 有重要的实用价值:①对政府部门,能够为政府出台人才政策 提供重要的参考依据。②对企事业单位,能够帮助单位更清晰 地认识人才紧缺情况,调整用人政策。③对高校、教育培训机 构,可根据目录针对性地开展培训项目,以使人才更好地契合 市场需要。④对高校毕业生、求职人员,能够了解市场的人才 需求,针对性地提高个人素质和能力。
 

目录编制说明

一、采用大数据方法

目录采用大数据的方法,通过抓取企业在互联网上发布的招聘信息,以海量数据为基础,采用大数据挖掘和分析技术手 段,并设计产业岗位紧缺度指数、紧缺岗位画像以及紧缺岗位 相关分析等进行目录编制。
 

目录编制以往采用问卷调查、企业访谈的方式,相比于之前的传统方法,大数据的方法能够解决传统方法的数据获取难、成本高、数据量有限、数据质量和代表性差的痛点。采用 大数据的方法使用机器从互联网自动采集数据,获取的数据规 模大,维度多,数据完备性(代表性)高,成本低,这些大数 据的特点能有效提高产业紧缺人才需求研究的准确性、实时性 以及分析内容的多维度丰富性。

基于大数据的产业紧缺人才需求业务模型_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 2:基于大数据的产业紧缺人才需求目录业务模型
 

通过大数据方法编制产业紧缺人才需求目录需要解决的三 个核心问题:
一是,要设计和建立一个岗位的划分标准,来统 一不同企业、不同数据来源的岗位名称描述问题。
二是,设计 岗位的紧缺度量化标准,划分出岗位的紧缺情况。
三是,建立 全面的、结构化的岗位要求描述标准(岗位画像),进行岗位 要求横向比较。

编制目录需要解决的核心问题_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 3:编制目录需要解决的核心问题
 

 二、设计岗位划分标准

通过对企业实际岗位和数据描述研究,建立结构化的标准岗位,一个标准岗位是由岗位级别、专业方向(又细分为专业 技术和专业领域)、岗位类别和职位名称(有细分为专业职位 和管理职位)总共 6 部分组成。分别对每个部分建立标签库(标 签从数据中学习而得),从而建立了标准岗位标签库。

标准岗位划分标准_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 4:标准岗位划分标准

 

通过机器学习从采集的数据中学习各个产业的标准岗位,

并建立标准岗位库。方法和结果见图 5。

建立标准岗位库方法和结果_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 5:建立标准岗位库方法和结果

 

 三、设计综合性的指标

通过结合数据分析和来自政府、企业、科研院所的专家研讨,设计用于衡量岗位的紧缺程度的高阶定量指标——紧缺度 指数。

紧缺度指数由需求规模指标、覆盖度指标、发布频率指标 三大指标构成。需求规模指标用来衡量岗位人数需求规模;覆 盖度指标用来衡量紧缺岗位在产业内的企业覆盖情况;发布频 率指标用来衡量岗位在时间上的紧缺情况。

并采用层次分析法对紧缺度指数的三个指标进行权重计算 并检验,从而完成紧缺度指数的量化。

紧缺度指数指标构成_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 6:紧缺度指数指标构成

紧缺度指数图_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 7:紧缺度指数图(以文化科技融合产业为例)

 

四、全方面地展示岗位(岗位画像)

通过对数据采集、处理和挖掘,从学历、专业、工作年 限、经验、能力素质、认证、专业技能、熟练程度等多个维度 构建岗位要求的标签库(标签同样从数据中学习而得),从而 建立紧缺岗位的岗位画像。同时,提取紧缺岗位画像核心标签 和关联情况、对紧缺岗位分析需求企业类型和规模以及紧缺岗 位工薪分布情况。

岗位画像结构设计_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 8:岗位画像结构设计

紧缺岗位画像_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 9:紧缺岗位画像(例图)

 

 五、岗位需求公司类型分布热度

对紧缺岗位需求发布公司的类型和规模进行分析。将紧缺岗位需求公司按照公司类型和规模进行分类,统计每个分类的 公司发布招聘需求数量建立分布热图。可以看出该紧缺岗位需 求主要分布在哪些类型的公司。

紧缺岗位需求分布热图_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 10:紧缺岗位需求分布热图(例图)

 

六、紧缺岗位画像标签关联规则

通过 Apriori 算法对紧缺岗位画像标签挖掘出核心标签并建立标签关联规则。图中箭头指向的标签为该岗位要求的核心 标签;圆形的大小表示和圆形相连接的标签共同出现的概率大 小,圆形越大,共同出现的概率越高;圆形的颜色深浅表示和 圆形相连接的标签关联强度,颜色越深,表示这些标签关联强 度越大。

紧缺岗位画像标签关联图_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 11:紧缺岗位画像标签关联图(例图)

 

 七、紧缺岗位工薪分布

岗位工薪分布图中红色直线和红色数值代表该岗位工薪平均值,蓝色直线和数值代表中位值,橙色和绿色直线数值分别 代表 75% 分位值和 25% 分位值;图中米色柱状图形高低代表该 工薪区段频数大小(柱形图的宽度为 1000 元),曲线(概率分 布密度曲线)峰顶对应的工薪值表示该工薪出现概率最大。

紧缺岗位工薪分布_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 12:紧缺岗位工薪分布(例图)

 

 八、基于机器学习的新兴产业数据挖掘和分析

目前对企业所属产业的划分标准依然是国家统计局公布的传统产业划分标准。这些划分标准已经很难适应现在的战略新兴产业以及其他维度的新兴、高精尖产业研究。通过采集并引入企业简介、经营范围、产品信息等海量企业数据,并结合新 兴产业的定义标准和权威产业研究论文等语料,进行文本挖掘 和机器学习分类器,将企业按照新兴产业标准进行分类,从而 可以进行新兴产业紧缺岗位人才需求研究以及新兴产业其他相 关研究。
 

九、岗位互联

通过对紧缺岗位数据互联,可以将近似岗位进行聚类,从而得到紧缺岗位转换路径,(见图 13),图中相近颜色的岗位 具有相似性,可以通过较低成本实现岗位转换,从而提供了另 外一个解决紧缺岗位的人才供给的渠道。

部分岗位互联_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
图 13:部分岗位互联(例图)

 

十、其他分析

以上仅是通过部分维度的数据进行了通用的数据分析,由于大数据维度丰富,还可以结合业务实际需求挖掘出更多的内容。
 

主要成果总结 在 2017 年目录的编制基础上,扩大了数据采集渠道,数据覆盖面更广、数据量更大;同时增加了产业细分领域、规范和 细化了岗位划分标准,使得目录涉及的岗位数量大幅增加,更 符合企业岗位实际情况。另外,在大数据处理、挖掘和分析工 具、模型上有了进一步优化和提升;从而进一步完善了紧缺岗 位画像,并从企业、职教机构需求出发增加了多角度紧缺岗位 分析。
 

主要成果包括以下几个方面:

一、获得海量的企业人才需求数据。

数据量 9000 多万条,覆盖六大战略性新兴产业的 38 个细分行业以及 7000 多个岗位,涉及 3 万多家企业(北京市)。
 

二、设计综合性的紧缺程度评价指标。

通过数据分析和专家研讨,设计用于衡量岗位的紧缺程度的综合指标——紧缺度指数,紧缺度指数综合考虑了岗位的需 求人数规模、岗位需求在产业内的企业覆盖情况、岗位需求在 时间上的紧缺情况。
 

三、编制六大战略性新兴产业的专业技术人才紧缺目录。

目录一共收集汇总六大战略性新兴产业专业技术岗位 7852 个,其中,紧缺岗位 692 个。六大战略性新兴产业的岗位紧缺
 

情况如下:

大数据产业紧缺岗位共计 215 个,其中,高紧缺岗位 65 个、较紧缺岗位 150 个。

智能制造产业紧缺岗位 93 个,其中,高紧缺岗位 42 个、较 紧缺岗位 51 个。

创新服务产业紧缺岗位 114 个,其中,高紧缺岗位 43 个、 较紧缺岗位有 71 个。

文化科技融合产业紧缺岗位 120 个,其中,高紧缺岗位 46 个、较紧缺岗位 74 个。

生态产业紧缺岗位 60 个,其中,高紧缺岗位 28 个、较紧缺 岗位 32 个。

大健康产业紧缺岗位 90 个,其中,高紧缺岗位 38 个、较紧 缺岗位 52 个。

_基于大数据的战略新兴产业紧缺人才需求预测_大数据_数据分析
 

四、构建紧缺岗位的岗位画像。

目录为每个紧缺岗位建立具体的岗位画像,从学历、专业、工作年限、经验、能力素质、认证、专业技能、熟练程度 等多个维度对岗位要求进行描述。
 

五、对紧缺岗位多角度进行分析。

首先,目录为每个紧缺岗位画像提取核心标签并进行标签关联分析;其次,分析每个紧缺岗位需求企业的类型和规模情 况;另外还对每个紧缺岗位建立岗位工薪分布图。目录的编制得到企业、高校等专业人士的广泛认可。依 据目录,职教集团和职业培训机构能够有的放矢地设计紧缺人 才指导方案。此外,目录还能为政府出台人才政策提供参考依 据;企事业单位能通过目录了解岗位人才紧缺情况和岗位相关 信息,调整人才招聘和培养措施,降低人力资源成本;高校、 培训机构可以根据目录调整课程体系、培训方案等,使得开展 的培训更符合企业实际需求;求职人员能根据目录针对性地提 高专业技能。
来源:CPDA数据分析