大数据方向的安全技术研究


来源:安全内参
近年来,随着大数据应用的爆发性增长,大数据衍生出独特架构,并推动存储、网络及计算机技术的发展,同时也引发了新的安全问题。国际社会已经将大数据安全列入国家信息网络安全战略,国内学术界、信息安全界、产业界也正逐步关注大数据的发展。
大数据安全_信息安全_大数据时代_数据分析

一、大数据相关概念


1.1 研究背景及意义

大数据是继云计算、物联网之后信息产业当前科技创新、产业政策及国家安全领域的又次知识新增长点。在大数据的背景下信息安全面临着很多的挑战,特别是现阶段已有的信息安全手段已经不能满足大数据时代的信息安全的实际要求,因此研究大数据时代所面临的信息安全问题具有重要意义大数据的研究与应用也引起了各国政府部门的重视,成为重要的战略布局方向。纵观国际形势,各国陆续出台大数据相关的政策及战略方案。2012 年,美国奥巴马政府宣布将投资 2 亿美元用于启动 “大数据研发倡议 ( Big Data Research and Development Initiative),旨在从海量繁杂的数据中萃取有用的信息。大数据下信息安全的事件所涉及的内容日益增多,受到的危险越来越严重的。信息安全问题需要经过多方面、多部门共同努力进行解决。
 

1.2 大数据概念

所谓大数据,即海量数据,具有信息量大、信息主体多元、更新速度快和价值密度低等特点,通常是指大量非结构化或半结构化的数据集。其实早在几年前,数据的海量增长就引起了人们的关注,海量数据的发生、使用、储存伴随着云计算的发展等都成为了现实,“大数据” 已经走入了我们的生活。最早将大数据用于 IT 环境的是知名咨询公司麦肯锡,麦肯锡在研究报告中指出:如果云计算为数据资产提供了保管、访问的场所和渠道,那么如何盘活数据资产使其为国家治理、企业决策乃至个人生活服务,则是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。

从信息安全角看,大数据是指规模和格式前所未有而又相互关联的大量数据,搜集自企业的各个部分,技术人员可以对它们进行高速分析。

就像电影《黑客帝国》中的感知机器人或者《终结者》电影中的天网一样,现在的大数据环境由大规模并行处理数据库产品 (不过所幸的是,它们没有自我感知能力) 组成,这些产品通过处理 PB 级 (1015) 到 ZB 级 (1021) 看似不同的数据来创建趋势和数据映射。通过建立这种宏观层面的信息,大数据可以让企业了解到他们的产品是如何以前所未有的经济理解水平在运行。也就是说,通过以新方式来结合和分析海量数据,我们可以实现新的业务洞察力.
 

1.3 大数据特征

大数据的 4V+1C 特征:

  • 1).Volume,数据量大,据国际知名数据公司 IDC 提供的数据,全球数据量大约每两年翻番,人类近两年产生的数据量相当于之前产生的全部。
  • 2).Variety,数据类型多,数据可分为结构化数据,半结构化数据和非结构化数据,相较便于存储的文本为主的结构化数据,日志,音频,视频,图片等非结构化数据,对数据处理能力提出了更高要求。
  • 3).Value,价值密度低,价值密度的高低与数据数量成反比。例如在连续的一小时监控过程中,可能有用的数据只有一秒。如何通过强大的计算机算法更迅速的完成对有用数据的提取, 是大数据背景下亟待解决的问题。
  • 4)Velocuty,处理速度快,这是大数据相较于传统数据挖倔最显著的特征,IDC 的 “数字宇宙” 报告预计到 2020 年,全球以电子形式存储的数据数量将达到 35.2ZB,在如此海量的数处理效率将成为衡量技术水平的关键。
  • 5)Complexity,复杂性加大,更提升了处理分析大数据的难度。

 

二、大数据安全问题

2.1 大数据时代面临的挑战

当前互联网改变着世界,信息渗透到社会生活的各个角落,与各个领域密切结合。同时也给国家信息安全和个人信息安全带来了严峻的挑战。随着数据量的增大和数据的集中,对海量数据进行安全防护变得愈加困难,网络空间中大数据大信息的泄露风险来源涵盖范围非常广,数据的大量汇集、数据的集中存储不可避免的增加了用户数据泄露风险。这些数据成为维护公共安全的重要工作。另外,对敏感数据的所有权和使用权没有明确的界定,大数据的分析对涉及的个体隐私问题很多都未考虑。再有,对国外大数据分析技术与平台的过分依赖,使得别国通过获取的情报而摸清国家经济和社会脉搏,威胁到了国家安全,加大了信息泄露的风险。

大数据安全面临的种种威胁如下:

(一)从基础技术角度看,大数据依托的基础技术—NoSQL(非关系型数据库)与当前广泛应用的 SQL(关系型数据库)技术不同,没有经过长期改进和完善,在维护数据安全方面也未设置严格的访问控制和隐私管理。NoSQL 技术还因大数据中数据来源和承载方式的多样性使得企业将很难定位和保护其中的机密信息。这是 NoSQL 内在安全机制的不完善,即缺乏保密性和完善性特质。另一方面, NoSQL 对来自不同系统,不同应用程序及不同活动的数据进行关联,也加大了隐私泄露的风险。此外, NoSQL 允许不断对数据记录添加属性,这也对数据库管理员的安全性预见能力提出了更高的要求。数据的大量汇集,无形中增加了黑客的 “收益率” 降低了进攻成本,使得一次成功的攻击能获取更多的有价值的数据。从近年互联网公司发生的某些用户信息泄露案不难发现,被泄露的数据量都非常的庞大。

(二)大数据时代,智能终端的数据安全问题显得越发关键。中国已经成为全球最大智能终端市场。随身携带的终端在占用人们大部分时间的同时,也存储了大量的个人信息。人们对于 “大数据并不安全” 的担忧也不无道理。因此智能终端数据的安全就提上了议事日程。智能家居的产品化,假如人们所使用的智能终端如手机可以控制家里的所有智能终端,一旦被病毒侵犯,那么全家的智能终端都成为了被攻击的目标,那后果就不堪设想。

(三) 与任何虚拟化技术一样,数据虚拟化是允许用户访问、管理和优化异构基础架构的良方。数据被人们视为财富的同时,大数据就成为了宝藏,数据虚拟化技术就是挖掘数据和利用宝藏的最好武器。最有代表性的应用就是数据的虚拟化存储技术。于用户而言,虚拟化的存储资源就像是一个巨大的磁石,用户不用关心具体的存储设备,也不必考虑数据经过的路径在应用虚拟化存储时,面对异构存储设备的特点,如何统一监管、虚拟化后不同密级信息混合存储的位置,造成的越权访问、数据泄密等成为大的难题。
 

三、大数据安全的对策


3.1 大数据信息安全对策

随着在线交易、在线对话、在线互动,在线数据越来越多,黑客们的犯罪动机也比以往任时候都来得强烈。如今的黑客们组织性更强,更加专业,作案工具也是更加强大,作案手段更是层出不穷。相比于以往一次性数据泄露或者黑客攻击事件的小打小闹,现在数据一旦泄露,对整个企业可以说是一着不慎满盘皆输,不仅会导致声誉受损、造成巨大的经济损失,严重的还要承担法律责任,所以在大数据时代,网络的恢复能力以及防范策略可以说是至关重要的。针对不同类型的大数据采取不同的决策,方法如下:

1) 结构化数据

大数据时代下数据非常复杂,数据量惊人,对于许多企业而言,保证这些信息数据的安全有效利用是非常严肃的问题。数据结构化对于数据的安全及开发有着及其重要的作用。结构化的数据便于加密管理和处理分类,能高效的分辨非法入侵的数据,从而保证数据的安全未来社会,数据标准化、结构化是大趋势.

2) 安全加固网络层端点的数据

通常分层构建是常规的数据安全模式。端点安全方式对于网络层的安全防护并不完美。数据时代的信息爆炸,非法入侵服务端的次数急剧增长; 云计算的大趋势,导致现在的网络数据威胁方式和方法难以预测辨识,给目前的端点数据安全模式造成了巨大压力。今后网络层安全应当作为重点发展。加强网络层数据辨识结构化、智能化基础上加强与本地系统监控协调,杜绝非常态数据的运行,形成网络层构筑属于大数据时代的全面安全堡垒,避免自身的缺陷。

3) 对本地数据加强安全策略

大数据时代数据的财富化导致大量的信息泄露,泄露事件中内部的威勒更大。在本地策略的构建上需要加入内部管理的监控,用纯数据的模式来避免人为原因造成的数据流失和信息泄露。在今后的数据安全监管手段中,逐渐分化管理者的角色权重,用数据本身的自我监控和智能管理来代替一大部分人为的操作,在本地安全策略的构建过程中还要注重与各个环节的协调,依托于网络这种数据处理方式,在数据的处理过程中往往出现大量的数据调用,调用过程中容易出现大的安全威胁。必须降本地和网络的链接,从根本上做到杜绝数据的安全威胁,就必须完善缓存机制和储存规则,保证数据源的纯洁。

4) 建立异构数据中心安全系统

传统数据存储都建立了全面完善的防护措施,但基于云计算架构的大数据,需要进一步完善数据存储隔离与调用间的数据逻辑关系设定,当前,用虚拟化海量存储技术来存储数据资源是大数据的安全存储方式,以服务的形式提供数据的存储和操作。在云共享环境中云计算的大数据存储,可以通过建立一个基于异构数据为中心的安全系统,使大数据的所有者可以对大数据进行控制,从系统管理上保证大数据的安全。

当企业转变为数据驱动的机器时,其潜力是巨大的:企业所拥有的数据可能成为获得竞争优势的关键。因此,企业的数据和基础设施的安全也变得比以往任何时候都重要。在许多情况下,企业或组织都可能得到 Forrester 所说的 “有毒的数据”。
 

四、总结


大数据时代的到来,信息成为了国家和社会发展的重要战略资源,带来了更多的安全风险,直接影响国家安全和社会稳定,同时也带来了新机遇。对于海量数据的分析提供了新的可能性,网络的异常行为有助于信息安全服务提供商更好地找出数据中的风险点。与此同时,大数据时代也对信息安全行业的发展有着积极的促进作用,大数据分析与安全软件相结合后信息安全问题将变的容易、快捷,大数据给信息安全带来了机遇和挑战,信息安全战略的制定需重视大数据的开发利用,多方位、多层次、多维度地维护国家信息安全。

继实验科学、理论科学、计算机科学之后,以大数据为代表的数据密集型科学或将成为新一次技术变革的基石,成为人类科学研究的第四大范式。面对挑战与机遇并存的大数据安全问题,在规划大数据发展的同时,要明确信息安全在大数据发展中的重要地位,加强对大数据安全形势的宣传力度,明确大数据的重点保障对象,加大对敏感,要害数据的监管,加快面向大数据的信息安全技术的研究,培养大数据安全的专业人才,建立并完善大数据信息安全体系。
45期CPDA课程