首页 理论教育云安全:隐私保护技术分类与度量

云安全:隐私保护技术分类与度量

【摘要】:对比上述三项隐私保护技术可知:基于数据加密的隐私保护技术虽然能够保证数据良好精确性和安全性,但却会消耗较多的资源,导致实用性偏差;基于数据失真的隐私保护具有较高的应用效率,但却会导致部分的数据信息丢失;而这也正是基于限制发布的隐私保护技术的缺陷所在。

1.隐私保护技术的分类

隐私保护主要是为了防止恶意者标识特定个体而造成的敏感信息泄露。目前,为了防止数据发布中的隐私泄露问题,研究人员在不同的应用领域提出了如下不同的解决方案

(1)针对个人隐私的保护方法 从保护个人隐私的角度来看,加密技术和匿名技术是当前最为通用的隐私保护技术。加密技术能够防止非法用户访问个人存储的隐私信息,也能够保护在通信网络中传输的隐私信息不被恶意的第三方所解读。

匿名技术能够在个人用户使用互联网的各种功能时提供匿名性,也可以防止用户个人信息的意外泄露。

(2)数据库中的隐私保护技术 隐私保护技术在数据库领域的应用主要集中在数据挖掘和匿名发布两个领域。从数据库应用角度进行分析,应用广泛的隐私保护技术主要包括三种[4]:①数据加密,对可能暴露的敏感数据进行加密处理,从而使数据库应用中的数据机密性得到保障;②数据失真,基于数据失真的隐私保护技术可以通过对原始数据进行扰动处理,从而有效保护数据的隐私性;③限制发布,基于限制发布的实质是通过对数据库系统发布环节的数据进行加工处理,并对满足一定条件的数据某部分域值进行泛化处理,进而实现对数据库隐私数据内容的有效保护。

对比上述三项隐私保护技术可知:基于数据加密的隐私保护技术虽然能够保证数据良好精确性和安全性,但却会消耗较多的资源,导致实用性偏差;基于数据失真的隐私保护具有较高的应用效率,但却会导致部分的数据信息丢失;而这也正是基于限制发布的隐私保护技术的缺陷所在。

2.隐私保护技术度量(www.chuimin.cn)

在信息领域,隐私保护技术需要在保护隐私的同时,兼顾其利用率和计算开销。而对信息领域内隐私保护技术的度量可以从以下几个方面考虑[5]

(1)隐私保护度 隐私保护度通常通过发布数据的披露风险来反映,披露风险越小,隐私保护度越高。

(2)数据缺损 数据缺损是对发布数据的数据质量的度量,反映了通过隐私保护技术处理后数据的信息丢失。数据缺损越高,信息丢失越多,数据利用率越低。主要有两个衡量指标:①信息缺损与可用性,数据的信息损失情况是一个重要参数,如损失率过大则数据失去可用性;②重构数据与原始数据的相似度。

(3)算法性能 通常利用时间复杂度对算法性能进行度量,有时也会考虑空间复杂度。在分布式环境中,还需要增加通信开销这个衡量分布式算法性能的常用指标。

(4)服务可用性 服务可用性是指信息的准确度和及时性,反映通过隐私保护技术处理后用户获得的基于位置数据的服务质量。通常需要在服务可用性与隐私保护程度之间需要进行权衡,提高隐私保护程度有时会降低服务的可用性。

(5)开销 数据隐私保护技术的开销主要包括预计算和运行时发生的存储和计算代价。存储代价主要发生在预计算时,预计算的代价在现有技术中通常可以接受,并在选择隐私保护技术时被忽略。运行时计算代价一般通过CPU时间以及文件块访问次数的时间复杂度进行度量。