数据分析向云迁移时如何避免混乱


作者:George Lawton
来源:企业网D1Net

组织在将商业智能(BI)和数据分析业务迁移到云端时,需要将现有分析流程、软件评估、数据保护和成本控制纳入一个深思熟虑的行动计划中。这是因为必须考虑许多问题:检查现有的分析流程、选择正确的云计算工具、保护信息、确保数据质量,而最重要的是设立精心设计的目标。

云计算提供了内部替代方案难以比拟的优势——更灵活、更快的开发和部署新技术,以及更大的潜在成本节约。SAP公司商业智能(BI)和混合分析产品营销总监Steve McHugh说:“大多数成功将业务迁移到云端的组织都有明确的愿景和战略,他们希望商业智能(BI)和分析在他们的智能企业中发挥作用。这对他们来说是一种创新,并不一定是将他们目前的业务转移到云端,尽管一些企业对此很感兴趣。”
 

采用实验思维

企业需要意识到,在云中的数据分析不仅是为了节约成本,还涉及新的可能性。云计算服务公司Candid Partners公司顾问Mitch Gibbs说:“通过访问可扩展、稳定的基础设施而无需维护它们的开销,企业可以扩展到当时所需的分析水平,同时级及将实验的启动成本降到最低。”

他建议分析经理将资源投入到实验过程中,以确定提供最大回报的分析方法,并对其进行投资。Gibbs建议道,“企业不要将分析视为应用程序的一次性构建。与其相反,需要设计其系统和流程,以便随着业务需求的变化而发展。”

下一步是为云中的数据分析设定有价值的、可实现的目标,例如降低商业智能(BI)和分析成本、加快查询速度、提高用户并发性、提高决策支持的质量,以及自动提供数据驱动的业务流程洞察力。SiliconAngle Media公司首席分析师James Kobielus说,“如果组织不能很好地确定想要实现的目标,就不要将其商业智能/分析工具从内部平台迁移出去。”

有许多基于SaaS的商业智能(BI)和分析工具需要考虑,它们在功能、价格、性能、地理可用性、行业和应用程序方面都有广泛的应用。设定目标有助于创建提供者的候选名单,以便在迁移计划的早期阶段实现目标。Kobielus说,“在决定哪一个将是组织的迁移目标之前,对这些提供商和产品功能进行尽职调查比较评估。组织决定是否只是在移动运营报告,或者是否也在将预测建模、数据挖掘、机器学习和其他高级分析应用程序迁移到云端,这一点很重要。”

Kobielus指出,为迁移项目做准备,这可能会花费比预期更长的时间和更高的成本。如果迁移许多数据库和大量需要为云计算从头开始重新构建的分析集合,其项目可能会更加复杂。

在确定迁移专业知识和选择工具时,有以下一些重要注意事项:

  • 组织是在迁移每个遗留的商业智能(BI)和分析应用程序,还是计划在迁移过程中取消许多未充分利用的应用程序?
  • 组织是否有必要的内部专业知识和工具来进行正确地迁移,或者组织是否需要聘请顾问?
  • 目标云平台的提供商是否具有专业服务和工具来帮助组织迁移?


审核现有的数据管理实践

人工智能数据管理平台Immuta公司云计算业务总经理Rob Lancaster说,“评估现有数据周围的数据管理基础设施和安全性非常重要。我们看到的一个主要问题是,数据传统上是由本地系统进行保护的,这些系统在云中是不存在的。很多组织意识到,一旦他们将数据迁移到云端,就不能像以前那样保护它,需要考虑不同且更灵活的策略来实现真正的数据分析,但已经太晚了。”

日志管理和安全分析公司SumoLogic公司产品营销总监Ben Newton表示:“我们应该注意到以往数据库的损坏。人们常常沉迷于收集数据而不是回答问题。”

企业在将数据迁移到云端之前,需要清楚地概述一些关键业务问题,并确定数据以回答这些问题。更好的是,选择一个特定的应用程序或业务领域作为开始。“不要试图处理整个数据湖。而是从一个数据池开始。”Newton建议说。他表示,他经常遇到企业在不反映实际情况的数据集上构建业务战略。为了使云计算中的数据分析取得成功,企业需要了解非结构化、结构化和半结构化数据分析的基本细节。这将使开发一种策略更容易,以满足传统、运行良好的商业智能(BI)工具和机器数据分析的需求。

Zendesk公司产品战略副总裁Sam Boonin说:“最好从云中可能存在的数据开始,例如数字客户旅程数据或与现有SaaS投资相关的数据。”这将有助于获得一些快速并熟悉基于云计算的商业智能(BI)环境。然后,将云计算转换计划构建到整体商业智能(BI)策略中,并随时间的推移迁移其余数据。

通常,商业智能(BI)面临的主要挑战是访问、清理和规范化数据。云计算使这些任务更容易,因为很多数据已经存在于AWS和Microsoft Azure等公共云中。但Boonin强调,企业的“数据管道”仍然需要一致的治理和IT工作。
 

控制数据和成本

越来越多的人担心云中的数据分析,尤其是通用数据保护规范(GDPR)等新法规,在迁移过程中会保护敏感信息。需要屏蔽或标记敏感数据。

数据隐私服务商BigID公司的联合创始人兼首席产品官Nimrod Vax表示,“数据的物理位置也是一个问题。由于组织无法始终了解或控制云计算提供商存储数据的位置,因此可能会无意中违反数据驻留法规。组织不仅需要知道他们的数据存储位置,还需要知道他们存储的数据。”他指出,那些能够在迁移到云之前映射数据的用户将更好地了解正在迁移的数据类型。

云计算定价可能很有吸引力,似乎是一个简单的切入点,但其成本可能无法预测。运营数据库管理系统提供商MarkLogic公司产品执行副总裁Joe Pasqua表示,“很多组织都无法准确估算成本。”

对云中的商业智能(BI)和数据分析而言,成本估算尤其具有挑战性。虽然运营工作负载通常由可重复的业务流程驱动,这可以使它们更具可预测性,但商业智能(BI)和分析可能受到用户和数据科学家的推动。Pasqua说,“总有一些分析要做,而采用云计算使得消耗更多资源变得非常容易。使用能够有效分析使用模式并控制使用情况的平台获得可预测的成本,这一点非常重要。”