非数据分析师需要理解数据建模的7个理由


对于在商业环境中的许多非技术人员来说,数据建模似乎是一个陌生甚至而有些可怕的领域。即使是那些在日常操作中经常进行数据处理和分析的人也常常将建模视为最好留给数据分析或信息技术人员的专门课题。

这在一定程度上来说是对的,因为高级数据建模往往可以很快就成为一个复杂的事情(尽管商业智能软件使得它变得相对简单),而且往往最好留给专业人士来处理。然而,即使您是非技术人员,也不创建公司范围数据模型,但是对数据建模有基本概念的了解可以帮助您,数据分析和业务部门实现最佳的商业信息流程。

 1.数据建模是所有分析过程的基础

一个经常引用的统计数据表明,分析人员可能会花费高达80%的时间准备数据进行分析。在数据准备过程中,除了清理和规范化数据之外,创建数据模型通常会占用大部分工作。更重要的是该模型将定义分析的类型,以及最终用户将能够查看的仪表板或报告。下面这个幻灯片总结了商业信息中数据建模的重要性:

 非数据分析员需要理解数据建模的7个理由
非数据分析员需要理解数据建模的7个理由

非数据分析员需要理解数据建模的7个理由
非数据分析员需要理解数据建模的7个理由非数据分析员需要理解数据建模的7个理由
非数据分析员需要理解数据建模的7个理由
非数据分析员需要理解数据建模的7个理由
非数据分析员需要理解数据建模的7个理由
非数据分析员需要理解数据建模的7个理由
非数据分析员需要理解数据建模的7个理由

这意味着要真正了解您的商业信息系统的功能和限制,您至少需要在概念层面了解数据结构。这并不意味着需要精通在后台运行的每个SQL查询。但它有助于您了解公司数据的收集,存储和管理以及它们如何联系到您的业务目标。

 

 2.加强与分析团队的沟通与协调

 

如上所述,您可能并不是在组织中架设数据模型的人员。然而,只要您分析数据- 甚至完全被动地作为每周报告的收件人- 数据模型就会影响您所看到的数据类型以及可以从中获取的结论。

 

能够有效地将业务规则传达给数据建模者,并从中了解他们需要什么来使数据符合这些业务规则,可以提高组织中正在使用的数据的质量和相关性。

 

商业信息系统最终旨在为企业服务,并使管理人员更容易做出数据驱动的决策。明确向商业信息系统项目负责人传达需求的能力也是实现这一目标的关键手段。

 

 3.数据建模驱动数据发现

 

假设你想要做的不仅仅是阅读静态报告- 即利用现代分析工具的能力来探索数据和执行特别分析- 那么你必须意识到数据模型是如何影响到你的商业问题。通过掌握连接各种数据源和表格的基本逻辑,您将能够增强独立分析数据并产生更有意义的见解的能力。

 

 4.自助式商业信息系统

 
 

尽管从头开始的完整数据建模对于专业人士来说确实仍然是最好的,但需要注意到的是,即使在处理来自多个信息源的数据时,今天的自助式BI工具也能提供广泛的DIY功能。有一个自助式商业系统的例子,Sisense提供简化的数据准备,使您能够根据易于识别的公共密钥自然地连接数据源,而无需任何脚本或编码,且简化与OLAP或星型模式的数据库系统的链接。

这意味着您可以完全独立完成大量的数据建模和分析,而不必打扰公司的专业数据分析或IT部门。

 

 5.了解数据模型告诉你什么是可行的分析

 

企业高管当分析师告诉他们当前系统无法执行表面上看似非常简单的分析时会感到沮丧。这些问题中的许多问题是由于数据建模问题而产生的,但比通常可解决的问题更为复杂。例如,由于需要适用于不同工具套件,数据模型可能会非常复杂。其他时候,在数据收集或存储的方式上有一些固有问题。即使没有能够快速地解决方案,只要是知道目前的状况,就能够以有效的方式分配分析资源。

 

 6.数据复杂度的上升伴随着数据建模

 

数据建模基本上定义了各种表和数据库之间的关系。如果您的组织仍在使用电子表格,这可能看起来不那么重要- 但是,随着数据越来越复杂,越来越多的公司发现自己经常依赖跨数据库分析。在这种状态中,定义这些不同数据源之间的关系以及您分析存储库的结构变得比以往任何时候都更加重要- 因为这些因素将会对您的公司处理商业智能的方式发挥巨大的作用,并且越早准备越好。

 

  7.数据结构素养助力职业发展

 

最后,除了上述所有之外,对数据结构有更多理解也是多多益善的。毕竟,这是一个数据驱动的世界,每一天,数据正在成为几乎每一个业务在正常运营中的一个愈发重要的因素。对数据有更多见解的人势必更能给出正确意见。并且精通数据模型将几乎肯定会使你更好的工作,特别是在管理层面。

  R语言作为一种数据分析专业语言,是当今数据科学领域最流行的开源编程语言之一,在数据分析与机器学习领域已经成为一款最重要的工具。精通R语言数据分析是企业竞相争抢的高薪人才!
第8期R语言数据分析&机器学习高级实战课程正在火热报名中!扫码送课程详细介绍!


R语言

作者:Eran Levy

来自:analyticbridge

翻译:吴鹏 Will