首页 理论教育字符型密文检索原理与应用

字符型密文检索原理与应用

【摘要】:字符型密文检索研究的热点主要是通过对字符数据建立安全索引,从而实施快速查询。微软公司在2009提出的加密的云存储中实现了基于密文的检索、基于属性的加密机制和数据持有性证明等技术[17]。比如当使用精确匹配查找密文时,不需要解密就能够检索成功。总之,目前的研究主要关注密文数据的检索方法以及提高密文检索效率,但现有研究在查询功能上还不能满足大数据的高效全文检索服务要求。

当用户数据以密文形式保存在云端服务器上时,可以确保敏感信息具有一定的安全性。但是,数据使用者在对这些数据进行处理时,不可避免地会需要对数据进行频繁地存取和加解密,这样就极大地增加了云服务提供商和使用者之间通信和计算的时间。因此,如果能快速地对密文数据进行检索,则对云安全具有一定的实用价值。

针对基于密文的操作问题,一种称为可搜索加密(SE)的技术应运而生。其工作原理如下[10]

用户首先使用SE机制对数据进行加密,并将密文存储在云端服务器;当用户需要搜索某个关键字时,可以将该关键字的搜索凭证发到云端服务器;服务器将接收到的搜索凭证后对每个文件进行试探匹配,如果匹配成功,则说明该文件中包含该关键字;最后,云端将所有匹配成功的文件发回给用户。在收到搜索结果之后,用户只需要对返回的文件进行解密。

目前,对密文检索技术的研究主要集中在如下两个方面:①等值匹配检索,主要的算法线性搜索算法、基于关键词的公钥检索和安全索引等;②密文区间检索,主要的算法有分桶实现区间检索和保序加密等。

Boneh等人[11]在非对称密码体制中引入可搜索加密,提出第一个带关键字搜索的公钥加密(PEKS)方法。其使用公私密钥来构建和检索密文,但该方法需要将检索对象和检索关键词逐个比对,检索效率很低,不适合对大数据量的加密文本进行检索。此外,该方案由于需要数据使用者和服务器之间共享一个安全通道,其实用性也较差。2005年,Baek等提出一种不需要安全信道的PEKS系统[12]

公钥混淆概念是由Ostrovsky和Skeith提出[13]的。其目标是通过加密程序来达到混淆的目的,即通过运行一个加密程序来处理一个加密的输出,之后再对加密输出进行解密。由于云计算平台上可以执行加密程序,而云服务器无法获知执行程序的其他信息,因此公钥混淆密码学可用于解决PaaS平台中存在的安全问题。(www.chuimin.cn)

私有信息检索(PIR)允许一个用户在保持询问隐私的情况下从数据集中检索信息。只有在数据使用者执行很多计算、通信复杂性仍然保持很小时,私有信息检索才被认为是可接受的。

字符型密文检索研究的热点主要是通过对字符数据建立安全索引,从而实施快速查询。比如,Song等人[14]采取序列加密方法对文本数据进行加密处理,这样无须解密就可以直接对加密文本搜索关键词。Li等人[15]基于关键词编辑距离,研究了云计算环境下加密字符型数据的模糊匹配查询,但是其需要语义库的支持。Wang等人[16]基于文本词频研究云计算环境下密文数据查询的结果集排序问题,但这种方法仅支持单关键词的排序查询。微软公司在2009提出的加密的云存储中实现了基于密文的检索、基于属性的加密机制和数据持有性证明等技术[17]

能够实现对密文进行检索是Rivest等人提出全同态加密概念的初衷之一,当数据被加密后,数据自身的一些特性将会消失,从而使直接对数据进行运算变得十分困难。比如当使用精确匹配查找密文时,不需要解密就能够检索成功。但是,当需要对査找的密文进行大量的模糊匹配或比较操作时,需要先对密文进行解密得到对应的明文后才能进行检索。

总之,目前的研究主要关注密文数据的检索方法以及提高密文检索效率,但现有研究在查询功能上还不能满足大数据的高效全文检索服务要求。其主要问题是对于普通的非同态加密方案,必须对密文进行解密才能进行检索,而解密同时会占用大量的计算资源[18]。不过,随着同态加密算法研究的进一步深入,将来一定能够研究出高效的密文检索方法,即采用同态加密方法才能够最有效地实现密文搜索。