首页 理论教育云安全与大数据:技术原理及实践

云安全与大数据:技术原理及实践

【摘要】:②大数据加大隐私信息的泄露风险。③大数据威胁现有的存储和安防措施。安全防护手段的升级速度无法跟上数据量非线性增长的步伐时,就会暴露大数据安全防护的漏洞。同时,黑客可以利用大数据发起僵尸网络攻击。比如,在涉及大数据安全性时,用户应当依据数据的敏感度进行分类,并对它们采取不同等级的保护措施。然而,大数据应用所产生的隐私问题和大数据系统存在的安全防范方面,目前还没有实质性进展和突破。

大数据概念是早在1980年,由著名未来学家阿尔文·托夫勒提出的概念。2009年,美国互联网数据中心证实大数据时代的来临。随着谷歌MapReduce和GFS的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。

目前,关于大数据的通用定义是:大数据是指所涉及的数据量规模巨大到无法通过目前主流软件工具在合理时间内获取、管理、处理,并通过挖掘辅助企业进行经营决策。大数据可以分为大数据技术、大数据工程、大数据科学和大数据应用四大部分。

大数据在近年越来越火热,大数据已经成为当前学术界和产业界的研究热点,正影响着人们的日常生活方式、工作习惯及思考模式。

在大数据时代,云计算和大数据的结合已经成为主流趋势。大数据需要灵活的计算环境,而云计算可以为大数据的快速生成和批量分析提供技术保障。同时,大数据时代的到来为云技术的发展尤其是云安全技术的发展带来新的机遇与挑战。

目前大数据的发展仍然面临着许多问题。其中,安全与隐私问题是人们公认的关键问题之一。与云计算中的数据安全问题相比,解决大数据安全与隐私保护问题更为棘手。因为在云计算中,虽然云服务提供商掌控着数据的存储与运行环境,但用户仍然可以通过加密等手段保护自己的数据。而在大数据的背景下,很多云服务运营商如Google,既是大数据的生产者,又是大数据的存储者、管理者和使用者。因此,单纯通过技术手段限制运营商对用户信息的使用,实现用户隐私保护是极其困难的。(www.chuimin.cn)

当前很多组织都认识到大数据的安全问题。比如,2012年云安全联盟组建了大数据工作组,旨在寻找针对数据中心安全和隐私问题的解决方案。2014年中国电子技术标准化研究院发布《大数据标准化白皮书》[19],白皮书指出:大数据时代,必须考虑大数据安全与隐私问题。

目前,大数据的存储和处理框架主要是分布式计算平台,如云计算。然而,大数据的分布式处理加大了数据泄露的风险。这主要体现在如下四个方面[20]:①大数据成为网络攻击的主要目标。一方面,大数据意味着其是更敏感的数据;另一方面,数据的大量汇集,无形中降低了黑客的进攻成本。②大数据加大隐私信息的泄露风险。数据集中存储增加了泄露风险,同时,目前多数基于大数据的分析都未考虑到其中涉及的个体隐私问题。③大数据威胁现有的存储和安防措施。大数据的大小会影响安全控制措施能否正确运行。安全防护手段的升级速度无法跟上数据量非线性增长的步伐时,就会暴露大数据安全防护的漏洞。④大数据技术可被应用到攻击手段中。大数据分析技术可以使黑客的攻击更加精准。同时,黑客可以利用大数据发起僵尸网络攻击。

大数据系统也可以存储敏感数据,因此在加密数据上进行计算,可以保护数据的机密性。由于数据量比较大,进行数据压缩是至关重要的一个操作。但是加密和压缩是相互矛盾的。一个有用的解决方案是确保数据压缩的空间收益和加密数据的机密性。

总之,在将大数据转移至云上时,需要采取相应的保护措施,确保用户既能享受云计算的灵活性,又能获得可靠的云安全策略。比如,在涉及大数据安全性时,用户应当依据数据的敏感度进行分类,并对它们采取不同等级的保护措施。然而,大数据应用所产生的隐私问题和大数据系统存在的安全防范方面,目前还没有实质性进展和突破。