来源:西部数据
“大数据”是“数据”的质变
从大数据与技术发展的关系角度来看,数据是以电子设备为载体的,二进制字段的表达。与数据有关的操作首先是计算机底层的技术问题——即通过一定的代码算法,实现数据的获取、使用、存储等。伴随着计算机与数据库等技术的不断发展,加之网络的出现,网络计算能力越来越强、数据获取范围越来越广、数据的使用用途也越来也多。所以“大数据”并不仅仅意味着数据量的“大”,更意味着数据的价值变“大”了。早在2001年,麦塔集团(META Group)(后被Gartner收购)分析师道格·莱尼(Doug Laney)提出大数据管理的3个方向——即时处理的速度(Velocity)、格式的多样化(Variety)与数据量的规模(Volume)。在此基础上,Gartner、IDC等国际咨询机构又提出了数据准确性(Veracity)、数据可视性(Visualization)与合法性(Validity)等要求。
从大数据与信息的关系角度来看,大数据指的是规模和格式前所未有而又相互关联的大量数据,搜集自网络空间和实体世界,技术人员通过高速、多方分析后,可以从中挖掘出甚至超出原有数据量级的信息量。这意味着,只有在大数据环境下才能够出现天量的信息。而对于这些信息载体进行再次或者多元的“大数据”分析,将会爆发出更多的数据与信息。因此,有学者提到,大数据时代的技术和现实变革是围绕着数据的“量”和“价值”展开的。
从大数据与网络空间的关系角度来看,海量的数据和相互之间的结构性、非结构性关联,使得大数据充分地扩展了网络空间。经过几十年的发展,人类社会早已经将自己的社会活动拓展到网络空间。网络空间不再是虚拟的角落。人类一方面利用大数据进行分析、拓展网络空间,一方面也在不断向网络空间贡献数据。
从大数据与社会效用的关系角度来看,诸多国家逐渐意识到大数据存在十分重要的战略价值。在国家战略层面,我国率先倡议网络空间治理的多个宏观原则——“尊重维护网络空间主权、和平利用网络空间、依法治理网络空间、统筹网络安全与发展”。这些原则映射到网络空间治理的微观层面就是大数据治理。在商业战略层面,大数据的发展让社会步入了数字经济时代。大数据所特有的基于数据分析、挖掘、获取和交易所产生的经济利用广阔前景和巨大的辐射力,是商业竞争中各参与主体竞相争夺的重要资源。
“大数据”是劳动对象也是劳动的结果
目前来看,数字经济中的“大数据”运用的商业模式主要分为两大类:第一类,以大数据为标的物的直接交易。这类交易指的是把狭义上的“大数据”——即数据集作为交易的标的物。第二类,以大数据分析之后的数据与信息为标的物的间接交易。这种交易指的是采用各项分析方法对数据进行挖掘、分析,产生大量的统计结果、主体偏好、决策参考等信息,基于这些信息的再利用、重组与拓展,形成商业决策和商业行为,例如利用行为画像的精准营销,基于大数据统计的投资决策等等。
与农耕经济时代以土地作为重要的生产资料、工业经济时代以石油等能源作为重要的生产资料类似,数字经济时代以大数据作为最基础也是最重要的生产资料。这两种商业模式中,前者所指称的“大”数据是交易对象,后者所谓的“大数据”是劳动的对象。但是我们需要敏锐地观察到,大数据能够成为生产资料的最重要原因是:数字经济的本质——信息经济。在大数据时代,信息的载体是数据。对于数据的分析与挖掘,其实质是生产各类信息产品。这就好比在土地上进行劳作,生产出来的是各种农业产品;对石油等能源材料进行劳作,生产出来的是各种工业产品。
数字经济时代的特点还在于,信息的流转具有循环性质,即人类不仅通过数据劳动获取信息;而且自身也在不断提供信息以被数据化。在前数字经济时代,信息的载体是口口相传或者文字记录。对于那些带有智力成果属性的信息采用了知识产权的方法加以确权;对于那些带有劳动服务性质的信息(例如请私家侦探进行的调查)采用了合同等方式加以确权。而在数字经济时代,数据与信息的特性导致数据的多重属性——同样的一个数据,有时候是劳动的对象和交易的对象,有时候是劳动的结果。这就是数据权属难以被确定的一个深层次原因。而目前,各国立法大多存在着数据与信息两词的互用,本质上是没有理解大数据作为数字经济“生产资料”这一判断。
作为生产资料的“大数据”的特点
“大数据”的形成方式和使用方式决定了其与一般生产资料的不同,其拥有无形性、外部性、多次使用性等特点。
(1)无形性。数据是以计算机等电子设备为载体的二进制表述,脱离于计算机数据无法存在。网络空间中的大数据也都需要存储在物理设备中。因此,无形性是大数据最基本,也是最显著的特征。同样具有无形性的知识产权是对于信息权属的拟制。正是大数据的无形性,造成了权属理解上的难度。
(2)外部性。数据存在于电子设备和网络中。由于数据控制的原因,数据往往存在被泄露或者失窃的风险;同时,出于使用的原因,数据可能会被主动公开。两种情况都会对非数据控制人或者数据权利与义务人产生溢出效应。例如用户在全网的各类行为数据会被商业主体免费获取。
(3)多主体使用与复用性。一方面,数据可以为一个数据控制者多次使用,数据的存在具有复用性;另一方面,数据可以同时或者非同时地为多控制主体使用。例如消费者在电子商务平台的一般消费数据可以同时被平台、平台商家、监管部门等使用。