中国工程院院士何友:工业大数据及其应用


作者:中国工程院院士、海军航空大学信息融合研究所所长何友
当前的互联网、大数据、云计算、物联网等前沿科技与人工智能技术的交叉融合与应用,正在深刻改变着人类社会生产与生活的模式。在2月2日举办的2018国家智能产业峰会上,中国工程院院士、海军航空大学信息融合研究所所长何友分享了《工业大数据及其应用》的主题报告,他认为,随着互联网信息系统及电子设备的发展,人类各行各业每时每刻都在生成海量数据,大数据时代正在到来,大数据隐含的战略价值引起了各国政府的重视。目前中国工业正面临着转型升级,迫切需要将大数据融合到经营管理与生产运营活动中,来促进制造企业向服务化、智能化转型升级。本文根据何友院士现场演讲速记整理而成。内容经原作者确认。
中国工程院院士、海军航空大学信息融合研究所所长何友作《工业大数据及其应用》主题报告

中国工程院院士、海军航空大学信息融合研究所所长何友作《工业大数据及其应用》主题报告
 

以下为演讲全文:

共汇报三个方面,第一个方面是概论与现状,这个我就简单过一下。随着互联网信息系统及电子设备的发展,人类各行各业每时每刻都在生成海量数据,例如社交媒体每天要产生12TB的数据,制造业波音737引擎每30分钟飞行产生10TB的数据,如此等等可以说大数据的时代正在到来,并且正在改变着我们的工作和生活。那么大数据隐含的战略价值已引起发达国家政府的重视,许多国家相继出台大数据战略,发展大数据应用。美国政府发力推动大数据行业的应用,2012年就把大数据上升为国家战略,2016年白宫出台联盟发展大数据发展的计划,2016年又加大拨款的力度。与此同时,英国以数据共享为根本积极推动大数据平台。英国2013年10月31日把大数据带来的机遇作为英国数据能力战略,同时相应出台一些政策法规。日本、法国、澳大利亚和瑞士也相应把大数据作为国家战略,这些大家都很熟悉了,这些国家除了颁布战略规划进行整体布局外,还十分注重配套的构建,目的都是为本国大数据发展构建良好的生态环境。我们国家各部委规划符合实际的发展战略路线图,像2014年到2017年大数均写入我国《政府工作报告》,2015年5月19号国务院发布《中国制造2025》的通知,将工业大数据发展作为重要工作内容。2015年12月29日,中国电子技术标准化研究院网站发布了《大数据标准白皮书2.0》,大数据标准由基础标准、技术标准、产品和平台标准、安全标准、应用和服务标准五个类别的标准组成。2017年发布了《2017年中国大数据发展报告》。

发改委2012年开始也发布了这方面的指南,组建了13个国家级大数据实验室。还有应用方面的,科技部973、863也陆续把大数据列入研究计划。这是科技部一些重点研发项目,像2018年云计算、大数据基础设施,基于云模式数据驱动的新兴软件,以及包括大数据分析应用与类人智能,也包括云端融合的感知认知与人机交互。

国家自然科学基金委在2013年开始将大数据列入发布指南,2014年200万以上项目达到18项。

工信部也是这样的,也把大数据发展规划作为重要的内容。2017年发布了大数据产业发展规划,加快实施大数据发展战略,加快大数据产业快速发展。

国家大数据中心,我们国家大数据中心有三大基地(北京、贵州、内蒙古)、八个节点。

大数据战略重点实验室。中共中央政治局,2017年12月9日,习主席强调大数据发展日新月异,我们应该审时度势、精心谋划、超前布局,力争主动,深入了解大数据发展现状和趋势一起对经济社会发展的影响,分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济发展和人民生活的改善。

工业大数据的时代背景。2012年麦肯锡在《工业大数据的崛起》报告中给出了一个有趣的事实,在虚拟经济占主导地位的美国,工业蕴含的数据总量超过其他部门,第二是工业部门已进入大数据时代,正以创记录的速度迅速增长。目前中国工业正面临着转型升级,迫切需要将大数据融合到经营管理与生产运营活动中,来促进制造企业向服务化、智能化转型升级。具体表现,第一是工业面临的问题和挑战,一是成本优势不在了,二是数据资源难用了,三是市场反应不准了,四是数据技术落后了,五是工业大数据已经形成,六是工业大数据技术需求迫切。

工业大数据的定义我就不讲了。

工业大数据的来源,产品全生命周期一般分为三个阶段,开发制造阶段、使用维护阶段和回收利用阶段。工业大数据来源于产品全生命周期各个环节的机器设备数据、工业信息化数据和产业链跨界数据,包括市场、设计、制造、服务、再制造等,每个环节都会有大量数据,全生命明周期会合起来的数据更大。

工业大数据的特征,一是数据价值密度高数据类型繁多,二是多源异构的结构化,三是数据处理实时性要求也是非常高的,四是数据关系和关联性异常复杂。

工业大数据的价值,大数据将在工业各个方面创造价值,像产品的创新、工业物联网、工业供应链的分析优化等等。这是工业大数据的平台,应该是最终驱动工业升级和产业整合。

带来的价值主要体现,第一是可适应从大定单大批量产销模式向小定单多规格的产销转变的需求。二是可满足在特定工艺水平和设备精度上,进一步改进和提升产品质量的需求。然后是适应市场竞争、缩短产品研制和生产周期的需要。

在工业大数据所推动的变革中,即使效率只提升1%,效益也是空前巨大的。如在全球节约1%的商用航空燃料意味着节约300亿美元的成本。工业大数据是工业互联网与工业4.0的核心关键技术,更是《中国制造2025》的重要工作内容,也是人工智能未来发展的一个基石。

工业大数据的现状,大数据正从零售、金融、电信、物流、医疗、交通等领域加速向工业拓展。百度的工业大数据监测平台已应用到汽车、日化等行业,三一重工利用大数据分析技术为智能工程机械物联网提供决策支持。

这些都不展开了,因为时间的关系。

2017年12月8日,工业大数据产业应用联盟成立大会在北京举行,联盟由联想集团和中国电子技术标准化研究院携手众多行业骨干企业共同发起。

工业大数据的一些代表性会议,第一是2015年的11月18日,国内首个专注于工业领域大数据应用的权威会议在北京举办。第二个是首届中国工业大数据产业发展高峰论坛在杭州举办。第三个是第十三届中国制造业国际论坛在天津召开。第四个是山东省科学技术年会及智能制造、工业互联网与工业4.0分会在济南召开。第五个是中国大数据产业峰会在贵阳召开。2017年5月5日,2017年中国工业大数据大会暨钱塘峰会在杭州召开。后面还有几个会议。

汇报第二个方面应用与案例,我简单汇报一下,这里面有八个方面的应用。第一是加速产品创新设计,传统的产品设计模式是基于设计师的灵感和经验,揣摩消费者的需求喜好,设计产品,针对性不强,不精确。大数据可拉近消费者与设计师的距离,精准量化客户需求,指导设计过程,改变产品设计模式。

未来产品的创新设计主要有三种模式,一是C2B定制模式,第二是垂直整合的制造模式,第三是柔性的制造模式。

这是一个示意图,一共有九个步骤。福特公司将大数据应用到福特福克斯电动车的产品创新和优化中,使这款车成为一款名副其实的大数据电动车。

Textron公司的战斗机Scorpion,2012年该公司利用大数据的思维深入分析国家、客户需求,发现急需增加生产战斗机的业务,更好地满足了国民警卫队和出口的需求,大幅提高了公司的核心竞争力,实现了真正意义上的产品创新,这说明未来行业的界限越来越模糊,它原来没搞过战斗机,没搞过飞机,经过自己的组装成功了。

华为Mate手机与天猫联合C2B,自2012年11月起,天猫与华为展开了一场日点击量超过24万次的用户调研,涉及CPU、核数、内存、屏幕、材质等,基于调研数据,华为通过大数据分析更好地认识了用户偏好,并直接用于华为Mate手机的研制中,非常有竞争力。

二是产品故障诊断与预测。案例一是波音公司,案例二也不展开了,案例三是宝钢大数据应用。

三是供应链的分析和优化,产品电子标识、物联网、移动互联网等技术能帮助工业类企业获得完善的产品供应链的大数据。基于大数据技术,利用销售数据、产品的传感器数据和供应商数据库的数据,企业可准确地预测全球不同区域的需求,通过跟踪库存和销售价格,可以在价格下跌时买进,从而可节约大量的成本。大数据将带来仓储、配送、销售效率的大幅提升和成本的大幅下降,实现供应链的优化。这是宝钢大数据应用的一个例子。

四是产品销售预测与大数据营销。大数据是一个很好的销售分析工具,通过历史数据的多维度组合,可以看出区域性需求占比与变化、产品品类的市场受欢迎程度以及最常见的组合形式、消费者的层次等,以此来调整产品策略和铺货策略。大数据是一种相对比较稳定的,并不是大起大落,或者实时性很强的一个环境,所以对大数据的应用是一个非常好的基础。那么基于大数据分析可以发现,在开学季高校较多的城市对文具的需求会高很多,这样可以对供货做一些调整。

五是生产计划与排程。大数据可以给予企业更详细的数据信息,发现历史预测与实际的偏差概率,考虑产能约束,人员技能约束、物料可用约束、工装模具约束,通过智能的优化算法,制定预计划排程,并监控计划与现场实际的偏差,动态的调整计划。

六是产品质量管理与分析。在工业类企业对产品进行管理与分析时会产生大量的数据,利用传统的分析方法难以发现数据之间复杂的隐性关联关系。然而利用大数据技术,建立质量管理分析平台可快速得到一个长长的传统单一指标的过程能力分析报表,更重要的是还可以从同样的大数据集中得到很多崭新的分析结果。特别是一些隐性结构往往价值是很高的。这是宝钢大数据的运用流程。

七是无线网络智能管控。随着移动数据业务、用户数量的增多和需求的差异化,用户出现等级分化,无线网络中的策略控制与计费方式需进一步考虑用户的匹配性,从而制定更合理的资源分配方式以适配不同层级的用户体验。

八是移动通信大数据网络的部署。移动通信大数据具备较高的空—时变化特征,传统固定的移动网络部署无法有效匹配某一特定区域内的流量与负载特征,超密集化的小小区部署也无法实时适配业务需求的动态变化。

九是基于通信大数据的金融征信判别。通信行业的大数据应用于金融行业目前是征信领域。目前,国内互联网金融发展的一大壁垒是信用体系的缺失,而运营商拥有的宝贵大数据将是较好的解决渠道之一。联通与招商银行成立的招联消费者金融公司是较好的方式。

十是典型案例,轮胎产业大数据关键技术研究及应用示范,联合申报的是玲珑轮胎股份有限公司。项目背景是轮胎制造数据与外部市场销售等相关数据的快速增长。这是它的具体流程。主要研究内容是研究轮胎产业大数据应用模式,整合轮胎全生命周期中产品设计、生产环节等等。这是大数据分析决策系统的一个登录界面,轮胎产业大数据分析决策系统可根据使用者在企业中的工作职能设定不同等级的权限,使系统中不同功能模块及数据,面向不同级别的使用者,对企业的重要数据及情报进行有效的保护。这是整个分析决策系统的主界面,有几个分系统。分为五个模块,主要是大数据资源中心、宏观销售预测系统、微观销售预测系统、质量分析系统、计划排程系统。

一是大数据资源中心,包括销售、计划、质量数据以及外部网站爬取获得各大相关行业的数据。这是它的一个子模块的界面。具体说五个大数据资源中心子模块可实现轮胎产业大数据资源的区分地域、数据来源和各相关行业多维度的管理和展示。

二是宏观销售预测系统,宏观销售预测模块主要基于轮胎行业大数据资源中心的数据,如轮胎原材料历史价格、人工成本、国内外宏观经济环境、汇率及利率变化、下游行业波动等进行深度综合分析,对轮胎制造业企业的宏观销售情况进行预测分析。这是它的子模块的界面,具体来说四个宏观预测子模块分别实现轮胎制造业主要原材料价格的波动预测、与轮胎制造业相关的海量新闻的自动收集、整理和重点推送及国内外市场的销量宏观预测。

这是微观预测系统的一个界面情况。微观销售预测模块整合企业内部数据和外部相关行业数据,通过建立模型分析预测具体型号轮胎的未来销量走势,为企业安排生产和调整产品结构提供支持。这是子模块的界面。具体来说三个微观销售预测子模块分别实现轮胎产业面向主机厂的整体销售预测、各主要型号的销售预测及对各主要型号的轮胎进行销量预警。

四是质量分析系统。质量分析系统模块标准化数据平台提供的生产全过程贯通数据,实现对产品全过程的追溯,采集聚类、分类、异常检测等数据挖掘方法,从原材料、配方、工艺、环境等多维度对产品生产全过程进行数据关联分析,来找出质量影响因素对关键供需及制造过程的影响关系,提升产品质量、故障诊断的效率。具体来说三个质量分析子模块可实现多维度全过程产品质量控制、基于产品质量宏观分析调整生产原料、工艺及环境等参数,产品质量可追溯到工艺等功能。

五是计划排程系统。计划排产模块根据市场订单量、销售预测量、备用库存量和现有库存量,制定下月实际生产量,充分合理的分配生产资源,通过充分挖掘工艺参数、成组生产、设备状态、调度规则等与订单交货期复杂关联关系。这是主要考核指标,整个的项目现在基本完成。预计今年上半年要进行验收,后来还要进行相应的推广应用。

面向制造业的大数据关键技术研究与应用,这个我就不展开了。

还有一个例子是纺织产业大数据关键技术研究与应用示范,这是烟台市科技计划项目,这是一些主要研究内容。

汇报第三个方面,技术与挑战。

面向工业大数据的思考。思考一,工业大数据和企业已有数据之间的关系。工业大数据应该遵循二八法则,第一是数据价值密度方面,也就是20%的SQL小数据具有80%的价值密度。他们之间是相互依存、不可分割的。思考二,工业大数据和业务流程的关系,传统企业信息化项目一般是从梳理业务流程起步的,流程主动、数据被动,而工业大数据环境下,要求企业快速满足个性化用户需求,企业僵化的长流程难以适应实时决策的要求。思考三,工业大数据的驱动力,这个不展开了。思考四,工业大数据的工作步骤,思考五,工业大数据的特殊性,因为时间的关系不展开了。

工业大数据的科学问题。一是数据来源多,数据类型不统一,数据质量要求高。研究突破工业大数据多源异构数据的实时集成与数据融合技术。二是数据存储的可靠性要求。三是工业大数据分析模型难度大,决策分析的影响因素多。四是需要构建工业大数据智能分析工具。五是需要大数据驱动下的工业物联网与智能制造模型。

工业大数据的关键技术。一是工业大数据平台架构与存储技术,二是多源异构工业大数据统一描述与集成分析技术,大数据驱动的工业系统分析与决策支持技术、工业大数据可视化技术,工业大数据容灾备份技术等等。

工业大数据学术研究方向,方向一是数据科学基础理论,方向二是大数据技术及应用,一是大数据分析与挖掘,大数据可用与可视化,大数据隐私与安全,四是大数据系统架构与基础设施,大数据存储管理模型与技术。

工业大数据面临的挑战。挑战一,大数据技术的应用仍有困难,第一是数据搜集,要对来自网络包括物联网和机构信息系统的数据附上时空标签,去伪存真,尽可能收集异源甚至是异构的数据,还可与历史数据对照,多角度检验数据的全面性和可信性。第二是数据存储,要达到低成本、低能耗、高可靠性目标,要用到冗余配置,分布和云计算技术,存储时对数据进行分类,并加入便于检索的标签。三是数据处理,利用上下文关联进行语义分析,现在关于上下文这种关联,也是一个国际上比较热门的一个领域。第四是可视化呈现,目前计算机智能化有了很大的进步和发展,但是谈不到深层次数据挖掘,现有数据挖掘算法在行业中难以应用,就是我们谈到的智能之路进步很大,但还很遥远。挑战二,大数据给信息安全带来新挑战,一是加大隐私泄露风险,二是对现有存储和安全措施提出挑战,三是被运用到攻击手段中。

工业大数据是新一轮产业革命的核心,是实现工业4.0、工业互联网和中国制造2025的重要抓手,将推动企业从制造走向智造。需要用全新的大数据思维模式开辟工业化建设实现跨越式发展的新途径。我的汇报完毕,希望各位同行、领导批评指正,谢谢大家!
来源:德先生

CPDA课程海报_大数据_数据分析