一种自动分级方法、装置及计算机可读存储介质与流程
- 国知局
- 2024-11-21 11:52:00
本技术实施例涉及数据处理,尤其涉及一种自动分级方法、装置及计算机可读存储介质。
背景技术:
1、政府数据资源分级管理是政府数据共享开放和数据治理的关键性工作,分级管理有助于提高政府数据资源利用效率,促进跨部门协同共享。但由于政府数据资源规模大、种类复杂,人工分级效率低下,难以应对快速增长的数据量,且缺乏专业的分级管理工具和技术支撑,导致分级结果存在主观性和不确定性。
技术实现思路
1、本技术实施例提供了自动分级方法、装置及计算机可读存储介质,可以提高分级结果的准确性。
2、本技术实施例第一方面提供了一种自动分级方法,包括:
3、构建政策法规本体库和典型案例本体库,所述政策法规本体库保存有图数据结构的政策法规本体,所述典型案例本体库中保存有图数据结构的典型案例本体;
4、将所述政策法规本体和所述典型案例本体中的关键字输入预先训练好的词向量模型,得到多个分级关键字向量;
5、获取分级查询信息,所述分级查询信息为用户输入的查询数据,所述分级查询信息包括至少两个输入词;
6、将所述分级查询信息输入所述词向量模型,得到对应的分级查询向量,其中,所述分级查询信息中的每一个输入词对应一个分级查询向量;
7、根据所述分级查询向量和所述分级关键字向量确定所述分级查询向量对应的关键字集合,所述关键字集合包括至少一个关键字;
8、将所述关键字集合输入推理机进行关于所述政策法规本体库或所述典型案例本体库的前向规则推理查询,得到所述推理机输出的分级结果。
9、可选的,所述将所述分级查询信息输入所述词向量模型,得到对应的分级查询向量包括:
10、将所述分级查询信息中的每个输入词依次输入所述词向量模型;
11、利用所述词向量模型的多视图学习子模型对每个输入词进行特征提取,得到多个视图下的稀疏特征向量;
12、利用所述多视图学习子模型对所述稀疏特征向量进行融合,得到综合词向量;
13、将所述综合词向量进行量子态叠加,得到量子态向量;
14、利用所述词向量模型的生成对抗网络对所述量子态向量进行优化,得到分级查询向量。
15、可选的,所述构建政策法规本体库和典型案例本体库包括:
16、利用本体构建工具对政府信息公开目录进行本体提取,得到第一政策法规本体;
17、将所述第一政策法规本体存入政策法规本体库;
18、利用所述本体构建工具对政府开放数据平台上的典型案例进行本体提取,得到第一典型案例本体;
19、将所述第一典型案例本体存入典型案例本体库。
20、可选的,所述方法还包括:
21、当所述政府信息公开目录更新时,获取第一更新信息;
22、利用所述本体构建工具对所述第一更新信息进行本体提取,得到第二政策法规本体;
23、将所述第二政策法规本体存入所述政策法规本体库。
24、可选的,所述方法还包括:
25、当所述政府开放数据平台更新时,获取第二更新信息;
26、利用所述本体构建工具对所述第二更新信息进行本体提取,得到第二典型案例本体;
27、将所述第二典型案例本体存入所述典型案例本体库。
28、可选的,所述根据所述分级查询向量和所述分级关键字向量确定所述分级查询向量对应的关键字集合包括:
29、分别计算每个所述分级查询向量和所述分级关键字向量的相似度;
30、对于任意一个所述分级查询向量,将最大的相似度对应的关键字作为所述分级查询向对应的分级关键字;
31、从所述分级关键字中筛选预设数量个组成关键字集合。
32、可选的,所述分级结果包括共享级别、开放级别和分级依据;
33、所述将所述关键字集合输入推理机进行关于所述政策法规本体库或所述典型案例本体库的前向规则推理查询,得到所述推理机输出的分级结果包括:
34、将所述关键字集合输入推理机进行关于所述政策法规本体库的前向规则推理查询;
35、若查询到包括分级内容且不存在条款冲突的政策法规,则将对应的分级内容作为分级依据,根据所述分级依据确定对应的共享级别和开放级别;若查询到包括分级内容但存在条款冲突的政策法规,则将效力最高的政策法规中的分级内容作为分级依据,根据所述分级依据确定对应的共享级别和开放级别;若查询不到存在分级内容的政策法规,则利用所述推理机根据所述关键字集合进行关于所述典型案例本体库的前向规则推理查询;若查询到包括分级内容的典型案例,则将对应的分级内容作为分级依据,根据所述分级依据确定对应的共享级别和开放级别;其中,分级内容包括数据共享和数据开放两方面内容。
36、本技术实施例第二方面提供了一种自动分级装置,包括:
37、构建单元,用于构建政策法规本体库和典型案例本体库,所述政策法规本体库保存有图数据结构的政策法规本体,所述典型案例本体库中保存有图数据结构的典型案例本体;
38、第一输入单元,用于将所述政策法规本体和所述典型案例本体中的关键字输入预先训练好的词向量模型,得到多个分级关键字向量;
39、获取单元,用于获取分级查询信息,所述分级查询信息为用户输入的查询数据;
40、第二输入单元,用于将所述分级查询信息输入所述词向量模型,得到对应的分级查询向量,其中,所述分级查询信息中的每一个输入词对应一个分级查询向量;
41、确定单元,用于根据所述分级查询向量和所述分级关键字向量确定所述分级查询向量对应的关键字集合,所述关键字集合包括至少一个关键字;
42、推理单元,用于将所述关键字集合输入推理机进行关于所述政策法规本体库或所述典型案例本体库的前向规则推理查询,得到所述推理机输出的分级结果。
43、可选的,所述分级结果包括共享级别、开放级别和分级依据;所述推理单元具体用于:
44、将所述关键字集合输入推理机进行关于所述政策法规本体库的前向规则推理查询;
45、若查询到包括分级内容且不存在条款冲突的政策法规,则将对应的分级内容作为分级依据,根据所述分级依据确定对应的共享级别和开放级别;若查询到包括分级内容但存在条款冲突的政策法规,则将效力最高的政策法规中的分级内容作为分级依据,根据所述分级依据确定对应的共享级别和开放级别;若查询不到存在分级内容的政策法规,则利用所述推理机根据所述关键字集合进行关于所述典型案例本体库的前向规则推理查询;若查询到包括分级内容的典型案例,则将对应的分级内容作为分级依据,根据所述分级依据确定对应的共享级别和开放级别;其中,分级内容包括数据共享和数据开放两方面内容。
46、可选的,所述第二输入单元具体用于:
47、将所述分级查询信息中的每个输入词依次输入所述词向量模型;
48、利用所述词向量模型的多视图学习子模型对每个输入词进行特征提取,得到多个视图下的稀疏特征向量;
49、利用所述多视图学习子模型对所述稀疏特征向量进行融合,得到综合词向量;
50、将所述综合词向量进行量子态叠加,得到量子态向量;
51、利用所述词向量模型的生成对抗网络对所述量子态向量进行优化,得到分级查询向量。
52、可选的,所述构建单元具体用于:
53、利用本体构建工具对政府信息公开目录进行本体提取,得到第一政策法规本体;
54、将所述第一政策法规本体存入政策法规本体库;
55、利用所述本体构建工具对政府开放数据平台上的典型案例进行本体提取,得到第一典型案例本体;
56、将所述第一典型案例本体存入典型案例本体库。
57、所述装置还包括第一更新单元,所述第一更新单元用于:
58、当所述政府信息公开目录更新时,获取第一更新信息;
59、利用所述本体构建工具对所述第一更新信息进行本体提取,得到第二政策法规本体;
60、将所述第二政策法规本体存入所述政策法规本体库。
61、所述装置还包括第二更新单元,所述第二更新单元用于:
62、当所述政府开放数据平台更新时,获取第二更新信息;
63、利用所述本体构建工具对所述第二更新信息进行本体提取,得到第二典型案例本体;
64、将所述第二典型案例本体存入所述典型案例本体库。
65、可选的,所述确定单元具体用于:
66、分别计算每个所述分级查询向量和所述分级关键字向量的相似度;
67、对于任意一个所述分级查询向量,将最大的相似度对应的关键字作为所述分级查询向对应的分级关键字;
68、从所述分级关键字中筛选预设数量个组成关键字集合。
69、本技术实施例第三方面提供了一种自动分级装置,包括:
70、处理器、存储器、输入输出单元以及总线;
71、所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
72、所述存储器中保存有程序,所述处理器调用所述程序执行第一方面及第一方面任意一种可能的实施方式中的方法。
73、本技术实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上保存有程序,所述程序在计算机上执行时使得所述计算机执行第一方面及第一方面任意一种可能的实施方式中的方法。
74、从以上技术方案可以看出,本技术实施例具有以下优点:
75、本技术实施例能够精确地将用户的分级查询与政策法规本体库和典型案例本体库中的关键字进行匹配,并利用前向推理机制生成相关的结果。这一过程提升了分级结果的准确性和智能化水平,同时确保了系统能够实时响应用户需求,为用户提供了更为精准和有价值的信息。
本文地址:https://www.jishuxx.com/zhuanli/20241120/333087.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。