大数据应用是近几年来才产生的专 业,随着计算机和信息技术的迅猛发展 和普及应用,行业应用系统的规模迅速 扩大,行业应用所产生的数据呈爆炸性 增长。企业大数据的应用需求已远远超 出了现有传统的计算技术和信息系统的 处理能力。
现在,大多数企业对项目管理、 项目统计、项目分析等过程中的信息处理较为简单,没有对项目生命周期等信息进行分类和评级管理,不能直观的知 晓项目的健康情况,这一问题在电项目 信息的处理中尤其空出,使得电信项目 管理者在决策的时候没有便捷的数据支 撑,无法评估项目的风险情况,难以满 足管理的需求。
《基于大数据分析的电信工程项目 风险管控模型》就是在这样的背景下诞生的。
二、模型简介
《基于大数据分析的电信工程项 目风险管控模型》是利用大量项目的业 务、财务还有其他类数据,从工程项目 的基本情况、工期情况、成本情况、财 务情况、投资情况,五个方面来量化工 程项目,并形成关键的指标变量,再继 续对量化后的指标变量重新进行清理、 提取和整理,结合公司多年在工程项目 管理领域中沉淀出来的经验,并通过指标权重的转换,利用数学模型和计算机学习来发现各指标变量之间的关系和规则,最后对模型进行不断的调试以提升预测准确率,以实现对项目健康情况进行评级评分和对项目的状态进行预测,最终达到项目风险的预防和管控。
《基于大数据分析的电信工程项目风险管控模型》目前包含项目评分模型(项目画像)和项目状态预测模型两个部分。通过模型的计算结果,为项目管理者提供清晰、准确、便捷的综合情况,最终能为管理人员进行经营决策提供辅助。
三、主要创新点
3.1 数据分析过程的标准化整个实施过程参考 CRISP -DM(cross-industry standard process fordata mining), 即为 "跨行业数据挖掘标准流程"。整个过程包含:商业理解、数据理解、数据准备、建立模型、模型评估、方案实施。
3.2 项目关键指标的量化整个创新思路是将工程项目的关键指标进行量化,是数据分析从商业理解到数据理解阶段的重要过程,量化的指标直接影响项目风险管控模型的搭建。需要将工程项目的基本情况、工期情况、成本情况、财务情况、投资情况转换成可以参与预测,或是可以进行预测的合理参数。
3.3 项目风险评估的大数据化在数据准备阶段,企业内部(外部)涉及项目的所有数据经过存储、清洗、加工后,都为企业对项目风控评估提供了健全、丰富的信息来源;基于此,企业以大数据技术进行分析和计算,从而准确地对项目风险进行评估。
3.4 项目风险评级的动态化项目风险的识别涵盖了项目的全过程和全专业管理。在项目的过程管理中,需要对各类数据进行全方位、多角度地去评估确认项目的风险等级。项目的不同阶段,会结合不同的权重值,来动态更新项目的风险等级,以辅助管理者更加全面、更加完善、更加客观的对项目的风险进行评级。
3.5 风险管控模型的智能化模型的建立是用数据挖掘的方法,从大量的、有噪音的数据中,发现潜在的规律和价值,以评估和预测项目的风险,通过不断充实项目的各类数据,让计算机自动选择最优的算法,保证项目风险控制模型的准确率,让模型变的更智能,并能辅助管理者以提高企业管理和决策能力。
3.6 管控模型结果的可视化运用可视化技术,将模型计算出的结果以柱状、饼状、盒须、热图、散点、地图、标靶、树状等多种方式,快速、醒目、清晰的展现出来,以辅助管理人员更容易的解读数据,更迅速的完成决策。
四、项目详细介绍
4.1 项目背景
电信工程行业正在告别高增长、高收益、高利润的 “三高” 时代,缓步踏入盈利放缓、利润收窄、投资下滑的 “新时期”。湖北电信工程公司在电信各级领导和各兄弟单位的关心和支持下,深入落实“价值引领、有效益发展” 总要求,抓管理、促发展、防风险、保稳定,求真务实,开拓进取,开源节流,去年在全面完成各项经营预算目标的同时,今年要继续拓展外部市场,逐步加强企业内部管控,不断完善制度建设,深化应用 IT 系统。
公司已经在 2014 年完成了项目业财一体化的 IT 系统改造,采集了大量基于单项工程的业务、财务和其他类别的数据,这使得能够利用数据分析和数据发掘出更多数据价值成为可能,《基于大数据分析的电信工程项目风险管控模型》就是在这样的背景下孕育出来的。
4.2 项目目标
建立项目风险管控模型,以增强公司对项目风险的识别和管控,提升公司对项目的精细化管理。公司将以增长和风控相辅助,齐头并进,以技术和管理相结合,双管齐下,最终达到为公司的经营管理保驾护航的目标。
4.3 项目过程
项目管理流程一般包括为三个部分:项目的启动、项目的计划、项目的实施及控制过程。
4.3.1 项目启动
在项目管理过程中,启动阶段是开始一个新项目的过程。启动信息技术(IT)和数据挖掘 (DM) 的项目之前,必须了解企业组织内部在目前和未来主要业务发展方向,这些主要业务将使用什么技术及相应的使用什么环境。
4.3.2 项目计划
在项目管理过程中,计划的编制是最复杂的阶段,项目计划工作涉及十个项目管理知识领域。计划的编制人员要有一定的工程经验,在计划制定出来后,项目的实施阶段将严格按照计划进行控制。
4.3.3 项目实施
在实施阶段中,采用 CRISP - DM 方法论把数据挖掘实践定义为六个标准阶段,分别是商业理解、数据理解、数据准备、建立模型、模型评估和模型发布。
商业理解
商业理解(业务理解)是明确要达到的业务目标,并将其转化为数据挖掘主题。要从商业角度对业务部门的需求进行理解,并把业务需求的理解转化为数据挖掘的定义。根据公司的业务、财务、人力、IT 管理等综合情况详细理解公司管理,为数据理解阶段提供理论基础。深度诠释公司业务范围、管理方式等数据理解数据理解是找出可能的影响主题的因素,确定这些影响因素的数据载体、数据体现形式和数据存储位置。数据理解从数据收集开始,然后熟悉数据。
公司 IT 系统介绍:目前公司正在使用的翔云系统是由中通服集团推行的集团级 IT 管理系统,整个翔云系统由业务管理系统、SAP ECC 和 BO 报表系统组成。
数据准备
数据准备阶段数据准备是将前面找到的数据进行变换、组合,建立数据挖掘工具软件要求格式和内容的宽表。通过对项目的各类数据进行 ETL 操作(将数 据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端 的过程)构建数据仓库,来实现项目在 工程、工期、成本、财务、投资、健康 情况的关键指标量化,为下一阶段数据 建模提供干净的基础数据。
建立模型
建立模型阶段建立模型是应用软 件工具,选择合适的建模方法,处理准 备好的数据宽表,找出数据中隐藏的规 律。在建立模型阶段,将选择和使用各 种建模方法,并将模型参数进行优化。
对同样的业务问题,可能有多种数 据挖掘技术方法可供选用,此时可优选提 升度高、置信度高、简单而易于总结业 务政策和建议的数据挖掘技术方法。在建 模过程中,还可能会发现一些潜在的数据 问题,要求回到数据准备阶段。建立模型 阶段的具体工作包括: 选择合适的建模技 术、进行检验设计、建造模型。
模型技术选择及算法包含:C5.0 决 策树算法、Logistic 逻辑回归算法、决 策列表算法、贝叶斯网络模型、判别模 型、KNN 算法、LSVM 经典局域支持向量 机算法、Random Trees 随机森林算法、 SVM 支持向量机算法、CHAID 算法等等;
通过对海量数据进行挖掘,发现数 据中的规律,发掘其中的价值,让数据 变成有价值的信息提供技术支持。
项目状态预测模型
对项目的工程状态进行预测,真正实现项目风险可预测、可管控的能力。 将被动工作转换为主动工作,真正实现 项目风险预估预测,将项目风险控制在 合理范围内,指导管理者对项目进行提 前管控。
模型评估
模型评估阶段模型评估是要从业务角度和统计角度进行模型结论的评估。 要求检查建模的整个过程,以确保模型 没有重大错误,并检查是否遗漏重要的 业务问题。
将公司系统中所有项目导入模型, 设置关键指标作为模型输入变量,设置 工程状态变量作为输出变量。根据输出 变量的属性选择适合的专家模型进行综 合比较。最后根据交叉校验比较结果, 最终选择 C5.0 决策树算法作为项目状态 预测模型的核心算法。
模型发布 建立模型本身并不是数据挖掘的目标,虽然模型使数据背后隐藏的信息和知 识显现出来,但数据挖掘的根本目标是将 信息和知识以某种方式组织和呈现出来, 并用来改善运营和提高效率。通过数据可 视化技术将模型的计算结果通过可视化技 术展现出来,让项目管理者能够快速、 清晰的洞察到管理中的风险点,为项目管 理,经营决策提供数据支持。
4.4 项目效益
4.4.1 数据个性化便捷展现 以前 IT 系统的的查询还是传统定义的查询功能,大量数据的查询速度相对较 慢。此次模型算法的引用,提高了速度, 增加了维度,丰富了视图,为领导审批、 计划、决策提供了快速可靠的信息;模型 算法的固化,可以将公司管理重点下沉到 数据采集的各个环节各个源头,企业各项 经营业务、财务信息能及时准确地得到反 馈,为战略决策和业务合作等各层次的管 理需要提供服务和支撑。
4.4.2 减轻了管理人员工作负担 数据模型可以根据管理要求进行模板定制,周期抓取数据,有权限的人都可随时登录查询关键的信息。数据信息 的共享不仅减少了管理人员日常查询数 据的工作量,而且提高了数据的准确率 和工作效率,避免了手工汇总统计可能 出现的错误。
4.4.3 增强了企业的风险防范能力 风险模型的引用使企业管理信息化程度更高,使企业信息数据实时更新成为 可能。在日常管理上可以充分利用及时更 新的数据信息,对企业各个环节进行实时 监控,有效发挥项目的预警功能,当出现 危机前兆时就会给出提醒,帮助决策者及 时纠正,降至企业运营风险。
4.4.4 使得企业管理更加科学化 项目风险管控模型通过对项目的基本信息、工期信息、成本信息、财务信 息、投资信息、健康信息等环节的分析 处理,从而对项目实施周期各环节形成 相应的联动关系, 使企业具有了生产经 营全过程的分析和预测能力。使日常管 理、经营决策更为快捷有效,让公司将 这些管控点环环相扣、层层相连,企业 管理更加科学化。
五、结束语
公司围绕 “全面深化改革” 以 及与之相配套的体制机制,内部管理正 在从依靠规模性指标,粗放式经验式管 理,向着深度挖掘数据价值,以数据驱 动管理、数据驱动运营,提升综合经营 能力的方向转变。让企业管理从经验驱 动, 向 IT 驱动( 技术驱动)向 DT 驱动(数据驱动)转型的方向升级。