一种基于区块链的深度神经网络模型版权保护方法
- 国知局
- 2024-07-31 22:58:42
本发明涉及数据安全,具体涉及一种基于区块链的深度神经网络模型版权保护方法。
背景技术:
1、随着互联网技术的飞速发展,借助大规模数据集的深度神经网络模型广泛应用于自然语言处理、欺诈检测、医疗影像分析、自动驾驶等领域。为了促进ai大模型的广泛应用,神经网络模型所有者通常会将模型作为云服务产品或软件提供给第三方使用。但是,深度神经网络模型尤其是那些大规模、高性能的模型,训练成本非常高,涉及昂贵的数据集收集和大量计算资源的消耗。例如,在维基百科和图书语料库(15gb)上训练bert模型需要近160万美元。因此,攻击者会使用微调、剪枝、模型提取等攻击手段对未经授权的深度神经网络模型进行窃取,导致模型版权侵权,对具有领域专家知识的高质量网络模型所有者造成巨大的经济损失。因此,深度神经网络是具有价值的知识产权,我们应设计相应的技术方案保护模型免受未经授权的复制和不合理的使用。
2、现有的神经网络模型版权保护技术通常借助第三方机构对版权信息进行储存、管理和鉴别,主要包含模型水印识别、模型指纹识别、模型相似性检查等方法。模型水印识别方法通过向模型注入仅所有者所知的水印来保护模型版权。模型指纹识别是一种非入侵的版权保护方法,通过从所有者模型中提取唯一标识符以将其与其他模型区分开来。如果所有者模型的标识符与可疑模型的标识符匹配,则可以声明所有权。模型相似性检查使用模型的相似度来解决身份问题,当两个模型之间的相似性越高,表明它们更有可能共享相同的身份。
3、基于水印的深度神经网络模型版权保护技术需要参与模型的训练过程,这会牺牲模型在主要任务上的性能并引入新的安全风险,同时模型容易收到自适应攻击,侵权者会试图删除或替换水印,从而避免水印认证。而深度神经网络模型指纹识别技术和相似性检查技术需要知道模型内部的参数和模型的训练数据,这泄漏了模型的关键参数,且难以识别经过剪枝、微调后的模型,因此在实际中难以有效应用。此外,现有的模型版权保护方案依赖第三方机构集中管理版权信息,但国内外负责版权管理的各种机构数量过多,用户难以识别其专业性和合法性,并且各机构之间等级不明确,导致版权管理混乱,一旦出现版权纠纷,这些机构难以提供具有公信力的版权归属证据,且确权的成本高昂、效率低下。同时,大多数版权管理机构都是采用中心化数据库存储版权信息,一旦中心数据库被攻击,那么中心数据库存储的版权信息将会失效,版权管理机构难以证明版权的归属。
技术实现思路
1、针对现有技术中的上述不足,本发明提供了一种基于区块链的深度神经网络模型版权保护方法,以期对深度神经网络模型资源进行可信存证、确权溯源等全生命周期的管理,藉此突破神经网络模型版权保护中所涉及的安全、隐私和可监管等技术难题,为促进深度神经网络模型的发布传播提供技术支撑。
2、为了达到上述发明目的,本发明采用的技术方案为:
3、一种基于区块链的深度神经网络模型版权保护方法,包括以下步骤:
4、基于深度神经网络模型确权请求,获取请求确权的神经网络模型;
5、调用区块链的深度神经网络模型确权合约提取神经网络模型的特征向量;
6、从星际文件系统中获取所有已确权神经网络模型的特征向量;
7、计算提取的神经网络模型的特征向量与所有已确权神经网络模型的特征向量的相似度;
8、判断计算的相似度是否达到侵权阈值;若是,则请求确权的神经网络模型不通过确权审核;否则将请求确权的神经网络模型及其特征向量上传至星际文件系统,请求确权的神经网络模型通过确权审核。
9、优选地,特征向量包括:
10、鲁棒性距离、神经元输出距离、神经元激活距离、层输出距离和层激活距离。
11、优选地,特征向量的相似度的计算式为:
12、
13、其中,表示特征向量的相似度,表示需要进行确权的神经网络模型,s表示星际文件系统中已确权的神经网络模型,t表示输入神经网络模型进行特征提取的样本,|λ|表示神经网络模型的特征集合,表示指示函数,表示两个神经网络模型在特征λ上的相似性,tλ表示特征λ的阈值。
14、优选地,从星际文件系统中获取所有已确权神经网络模型的特征向量包括:
15、从区块链中获取保存的所有已确权神经网络模型在星际文件系统中哈希值;
16、根据哈希值从星际文件系统中获取保存的所有已确权神经网络模型及其特征向量。
17、优选地,还包括:
18、调用区块链的版权通证管理合约为通过确权审核的神经网络模型生成版权通证,并将版权通证的归属设置为发送版权登记请求用户地址。
19、优选地,版权通证包括:
20、版权通证编号、唯一性标识、深度神经网络名称、深度神经网络模型哈希值、作者和版权通证创建时间戳。
21、优选地,还包括:
22、基于版权通证转移请求,调用区块链的版权通证管理合约验证用户身份,然后在身份验证通过后将版权通证转移给其他用户,并更改版权通证归属信息。
23、优选地,还包括:
24、基于版权通证购买请求,调用区块链的版权通证管理合约查询买方账户余额,然后在账户余额足以购买对应的版权通证时将版权通证转移给买方,并更改版权通证归属信息,最后修改交易双方账户余额,将交易款项由买方用户转移到卖方用户。
25、优选地,还包括:
26、初始化所有共识节点,为所有共识节点生成分布式密钥,并选出主节点;
27、在request阶段,客户端节点c向当前共识网络中的主节点pn发送请求消息<request,tx,t,c>σc,其中tx表示交易信息,t为时间戳,σc为客户端c对该请求消息的数字签名;
28、在pre-prepare阶段,主节点接收到request消息后,验证其合法性;若验证不通过忽略该消息;若验证通过,主节点将该消息加入交易池,当在交易池达到交易阈值时将交易集合打包成区块b,构建pre-prepare消息〈〈pre-prepare,d,v,n〉σp,b〉发送给其余副本节点,其中d为区块b的摘要,v为当前的视图编号,n为主节点为消息生成的序号,σp为主节点对消息的数字签名;当副本节点i接收到pre-prepare消息后,验证消息签名和区块摘要,确定消息的安全性和合法性,确定当前节点是否也处于视图v;若验证通过,副本节点i将pre-prepare消息保存在本地缓存中,并构建replica-sign消息〈replica-sign,v,n,i,t(r)〉σi发送给主节点,其中r为pre-prepare消息的摘要,ti(r)为节点i对r的数字签名,σi为节点i对replica-sign消息的数字签名,其余参数与pre-prepare消息中的参数一致;
29、在sign-collect阶段,主节点收到副本节点发来的replica-sign消息后,验证消息签名,并确定当前视图是否为v,n是否和本地保存的pre-prepare消息一致;若验证通过,将消息保存在本地缓存中,在接收到2f+1个不同节点的ti(r)后,生成签名聚合t(r),构建verify消息〈verify,v,n,t(r)〉σp广播给其余副本节点;
30、在verify阶段,副本节点i接受到主节点发来的verify消息时,验证消息签名,确定当前视图是否为v,n和验证签名聚合t(r)的合法性;若验证通过,节点i构建prepare消息〈prepare,v,n,i,t(t(r))〉σi发送给主节点,其中ti(t(r))为节点i对t(r)的数字签名;
31、在prepare阶段,当主节点收到副本节点发来的prepare消息时,验证消息签名以及v和n的正确性;若验证通过,将消息保存在本地缓存中,当主节点收到2f+1个由不同节点发来的prepare消息后,通过2f+1个不同的ti(t(r))生成签名聚i合t(t(r)),构建commit消息〈commit,v,n,t(t(r))〉σp广播给其余副本节点;
32、在commit阶段,当副本节点i接受到主节点发来的commit消息后,验证消息签名以及v和n的合法性;若验证通过,验证二次签名聚合t(t(r))的合法性,若验证通过,表明至少2f+1个节点对该请求达成了共识;副本节点将i执行区块b中的操作,并发送给客户端节点;
33、在reply阶段,当客户端节点接收到f+1个相同的reply消息,表明请求的操作已经完成;若在超时前仍未接受到足够的reply消息,表明该请求共识失败,需要重新发送请求;
34、当副本节点怀疑主节点是拜占庭节点时,副本节点启用视图切换协议更改主节点。
35、优选地,当副本节点怀疑主节点是拜占庭节点时,副本节点启用视图切换协议更改主节点,包括:
36、在当前视图v1时,副本节点i将主节点作为拜占庭节点,并给新视图v2的新主节点发送view-change消息其中n为最新的稳定检查点,c为稳定检查点n的2f+1个checkpoint消息的签名聚合,p为当前节点达到prepare阶段且序号超过n的请求集合;
37、新主节点p接收到多个合法view-change消息,构建new-view消息并发送给其余节点,其中v为2f+1个view-change消息的签名聚合,o为预准备消息集合,该集合包括2f+1个view-change消息中最新的稳定检查点和最新的请求消息之间的请求;当副本节点i收到new-view消息后,验证其合法性,若验证通过进入视图v2,并对o内的pre-prepare消息重新进行共识。
38、本发明具有以下有益效果:
39、(1)本发明采用基于智能合约的神经网络模型版权保护方法,提取深度神经网络模型的特征向量作为确权审核的依据,将特征向量之间的相似度作为衡量是否侵权的标准,实行链上链下相结合的存储方式,降低模型版权认证成本的同时,使神经网络模型的可信确权和安全管理得到了保障。
40、(2)本发明采用基于阈值签名的拜占庭容错机制作为版权保护系统的共识算法,降低了共识算法的复杂度,有效提高了系统资源的利用率和区块链版权认证系统的性能;
41、(3)本发明使用区块链技术实现深度神经网络模型的版权保护,包括网络模型特征上链存储、版权交易流转存证、版权信息在线查询和高可信版权身份审计的功能,有效解决了现有版权保护技术中存在的模型信息泄露的问题,有效增加了隐私性、可监管审计等特性,进一步完善了神经网络模型版权保护的技术体系。
本文地址:https://www.jishuxx.com/zhuanli/20240730/195573.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。