上篇我们简单的介绍了什么是数据挖掘,本文我们将继续解读在数据分析项目中数据挖掘为企业带来的价值。
典型的数据挖掘项目首先要求正确的业务问题,收集正确的数据来回答它,并准备数据进行分析。后期阶段的成功取决于早期阶段的情况。数据质量差会导致结果不佳,这就是为什么数据挖掘者必须确保他们用作分析输入的数据的质量。
典型的数据挖掘项目从提出正确的业务问题开始,收集正确的数据来回答它,并为分析准备数据,后期的成功取决于前期发生了什么,糟糕的数据质量将导致糟糕的结果,这就是为什么数据采集器必须确保作为分析输入的数据的质量。
数据挖掘从业者通常通过遵循以下六个步骤的结构化,可重复的过程来实现及时,可靠的结果:
在整个过程中,领域专家和数据数据挖掘者之间的密切合作对于理解数据挖掘结果对正在探索的业务问题有至关重要意义。
数据挖掘和数据科学的未来前景一片光明,因为数据量只会增加。到2020年,我们累积的数字数据世界将从4.4 zettabytes增长到44 zettabytes。我们还将为地球上的每一个人每秒创造1.7兆字节的新信息。
正如挖掘技术由于技术的改进而发展和改进一样,从数据中提取有价值的内部信息的技术也是如此。曾几何时,存储和计算数据的成本实在是太高了,只有像NASA这样的组织才能使用子代超级计算机来分析数据。而现在,很多公司正在用机器学习、人工智能和基于云的数据湖做各种各样有趣的事情。
例如,物联网和可穿戴技术已经把人和设备变成了数据生成机器,如果企业能够足够快地收集、存储和分析数据,就能对人和企业产生无限的洞见与见解。
预计到2020年,物联网(IoT)上将有大约200亿个连接设备。生成的大部分数据将在云上提供使用,这就迫切需要灵活、可扩展的分析工具,可以处理大量信息和不同的数据集。
基于云的分析解决方案使企业访问大量数据和计算资源变得更加实用和经济。云计算帮助企业快速收集来自销售、营销、网络、生产和库存系统以及其他来源的数据,进行分析并有效改善成果。
随着企业继续被大量内部和外部数据所淹没,他们需要能够以其业务所需的速度将原材料提炼为可操作的见解,在整个过程中,数据分析师是其中尤为重要的组成部分。当然其中也包括大数据分析解决方案服务的公司。