技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种抗合谋多文件隐私信息检索方法及系统  >  正文

一种抗合谋多文件隐私信息检索方法及系统

  • 国知局
  • 2024-12-06 12:59:39

本发明属于隐私信息检索领域,尤其涉及一种抗合谋多文件隐私信息检索方法及系统。

背景技术:

1、大数据与云计算技术的飞速发展,在为人们获取信息提供巨大便利的同时,也带来了用户隐私信息泄漏的风险;例如,当前多数搜索引擎会分析用户的搜索行为,做出相应的个性化定制或广告推广;在对一些敏感的数据库进行检索时,用户的个人隐私需要受到保护;隐私信息检索(private information retrieval, pir)允许用户向服务器发送查询以检索需求的文件,同时保证服务器无法得到所检索文件编号的任何线索。

2、pir问题最早起源于密码学领域,与不经意传输、隐私计算、安全多方计算等研究方向有密切关联,其主要优化指标为通信量(检索单比特所需的上传与下载)和算法复杂度;sun和jafar在其2017年的奠基性工作中,将密码学领域的pir问题推广至分布式存储系统中,检索的目标也从单个比特衍生为一个充分大的文件。

3、分布式系统中的pir问题的一般描述如下:在一个基于码的分布式存储系统中,个文件经由编码被存储于个服务器中,用户希望在成功检索单个需求文件的同时,保证任意个合谋的服务器无法得到所检索文件编号的任何信息;分布式存储系统pir方案效率的衡量指标称为pir码率,即需求文件的大小与总下载量之间的比值。

4、近十年来,分布式系统pir问题是信息科学前沿热点问题之一,近百篇相关主题的文章发表于国际信息论旗舰期刊ieee transactions on information theory。然而,绝大多数研究只考虑单文件检索。在多文件pir检索方面,banawan和ulukus在2018年的工作中指出,同时检索多个文件的效率严格优于多次重复执行单文件pir方案,这表明多文件pir检索方案的研究具有实际的应用价值。在banawan和ulukus的工作中,若检索文件数量严格小于,其方案的pir码率与信息论理论界之间仍有一定差距。同时,他们的工作仅针对了这一退化情形(即复制存储系统、服务器之间无合谋),而未考虑一般的参数和。

5、因此,现有的多文件隐私信息检索方案存在局限性。

技术实现思路

1、为克服上述现有技术的不足,本发明提供了一种抗合谋多文件隐私信息检索方法及系统,基于边际信息查询和需求信息查询,高效实现在基于任意码的分布式存储系统中的可抵抗任意个服务器合谋的多文件隐私信息检索。

2、为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:

3、本发明第一方面提供了一种抗合谋多文件隐私信息检索方法。

4、一种抗合谋多文件隐私信息检索方法,包括:

5、通过文件分包、编码存储的方式,将若干个文件分布式存储在多个服务器上,构成分布式存储系统;

6、获取需求文件的检索信息,连同存储参数,进行查询轮次的选定,构建多个备选检索方案;

7、根据检索方案的pir码率,从多个备选检索方案中选取最优的检索方案;

8、通过执行最优的检索方案,得到需求文件的内容;

9、其中,所述检索方案由多轮包含需求信息查询和边际信息查询的轮次和一轮只包含需求信息查询的轮次组成,利用边际信息查询的结果消除后续轮次需求信息查询结果中的非需求文件,得到需求文件的内容。

10、进一步的,所述文件分包、编码存储的方式,是将文件切割为份原始数据包,每个数据包通过码,生成份编码后的数据包,分别存储于个服务器中。

11、进一步的,所述存储参数,包括分割个数、服务器个数、文件总个数;

12、所述需求文件的检索信息,包括需求文件个数、各个需求文件的编号及合谋服务器个数。

13、进一步的,所述检索方案包括若干个轮次,每个轮次包括若干个阶段,每个阶段中需求用户向各个服务器发送问询请求,服务器返回问询响应;

14、其中,所述问询请求,是以个文件的检索符号之和的形式,批量请求这个文件存储在服务器上的文件数据包,为轮次序号;

15、所述问询响应,是服务器返回检索符号所指向的文件数据包。

16、进一步的,所述查询轮次的选定,是从个轮次中,选择个轮次,其中,前个轮次包含需求信息查询和边际信息查询,第个轮次仅包含需求信息查询;

17、所述边际信息查询,是只有非需求文件的检索符号之和的查询;

18、所述需求信息查询,是包含需求文件的检索符号之和的查询。

19、进一步的,所述备选检索方案的构建,还包括:基于存储参数、检索参数,计算方案参数和;

20、利用方案参数和,分别进行以下计算:

21、(1)计算选定的个轮次各自的阶段数目;

22、(2)利用方案参数和,设定所有文件的检索符号;

23、(3)利用方案参数和,计算每个方案的pir码率。

24、进一步的,所述检索符号的设定,是通过预先选定的编码矩阵,对每个文件的数据包进行编码,得到文件的检索符号。

25、本发明第二方面提供了一种抗合谋多文件隐私信息检索系统。

26、一种抗合谋多文件隐私信息检索系统,包括文件存储模块、方案构建模块、方案选优模块和检索执行模块:

27、文件存储模块,被配置为:通过文件分包、编码存储的方式,将若干个文件分布式存储在多个服务器上,构成分布式存储系统;

28、方案构建模块,被配置为:获取需求文件的检索信息,连同存储参数,进行查询轮次的选定,构建多个备选检索方案;

29、方案选优模块,被配置为:根据检索方案的pir码率,从多个备选检索方案中选取最优的检索方案;

30、检索执行模块,被配置为:通过执行最优的检索方案,得到需求文件的内容;

31、其中,所述检索方案由多轮包含需求信息查询和边际信息查询的轮次和一轮只包含需求信息查询的轮次组成,利用边际信息查询的结果消除后续轮次需求信息查询结果中的非需求文件,得到需求文件的内容。

32、本发明第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的一种抗合谋多文件隐私信息检索方法中的步骤。

33、本发明第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的一种抗合谋多文件隐私信息检索方法中的步骤。

34、以上一个或多个技术方案存在以下有益效果:

35、1)本发明通过构建由多轮包含需求信息查询和边际信息查询的轮次和一轮只包含需求信息查询的轮次组成的检索方案,利用边际信息查询的结果消除后续轮次需求信息查询结果中的非需求文件,得到需求文件的内容,实现在基于任意码的分布式存储系统中的一种可抵抗任意个服务器合谋的多文件隐私信息检索方案,可针对任意合适的参数和,即允许系统从的复制存储推广为任意和的编码存储,且允许了服务器的合谋。

36、2)banawan和ulukus先前的工作中,在第轮到第轮中默认选取了第轮,未意识到此处的选取会对检索效率造成影响。本发明考虑了各轮次选取的异同,并可高效计算选择各轮次所能得到方案的pir码率,从而对给定的参数、、、、,可选择出最优的轮次q。例如,在,,,时,banawan和ulukus默认选择第5轮次,方案pir码率为;而本发明则选择第4轮次,方案pir码率为,因此可见本方案的检索效率得到了大幅度的提高。

37、3)本发明的检索效率皆远优于多次重复单文件检索方案的效率,因而在实际的多文件检索过程中可切实提高检索效率。

38、本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

本文地址:https://www.jishuxx.com/zhuanli/20241204/343104.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。