技术新讯 > 计算推算,计数设备的制造及其应用技术 > 政务工单情感风险分析方法、装置及介质与流程  >  正文

政务工单情感风险分析方法、装置及介质与流程

  • 国知局
  • 2024-10-09 15:16:19

本公开至少涉及情感识别,尤其涉及一种政务工单情感风险分析方法、政务工单情感风险分析装置以及计算机可读存储介质。

背景技术:

1、政务热线领域,工单数据主要为系统接收到投诉信息,工单存在上下文语义关联,主要为短文本,其目标突发事件文本属于小概率事件,样本较少,导致政务热线没有标记好的语料库用于训练,同时也缺少专用的词嵌入矩阵,影响了对政务工单的情感识别。

技术实现思路

1、本公开所要解决的技术问题是针对上述不足,提供一种政务工单情感风险分析方法、政务工单情感风险分析装置以及计算机可读存储介质,以解决如何识别政务工单情感风险的问题。

2、第一方面,本公开提供一种政务工单情感风险分析方法,所

3、述方法包括:

4、获取第一政务工单专用词嵌入矩阵,第一政务工单专用词嵌入矩阵中包括携带了各分词在历史政务工单中出现信息的、除偏后的词嵌入向量;

5、根据第一政务工单专用词嵌入矩阵,获取待分析政务工单中每个第一分词的第一词嵌入向量,根据第一词嵌入向量组成第一词嵌入矩阵;

6、将第一词嵌入矩阵输入情感分析模型,以获取待分析政务工单的情感风险。

7、进一步地,获取第一政务工单专用词嵌入矩阵,具体包括:

8、获取通用词嵌入矩阵模型;

9、使用历史政务工单对通用词嵌入矩阵模型进行迁移学习,以获取政务工单专用词嵌入矩阵模型,并使用政务工单专用词嵌入矩阵模型根据历史政务工单输出第二政务工单专用词嵌入矩阵;

10、对第二政务工单专用词嵌入矩阵中的代表性偏见词进行除偏处理,以获取第一政务工单专用词嵌入矩阵。

11、进一步地,获取通用词嵌入矩阵模型,具体包括:

12、获取知识类问答数据集;

13、获取知识类问答数据集的第二分词;

14、获取第二分词基于中文词汇的第二独热编码;

15、获取由第二独热编码按照第二分词在知识类问答数据集中的前后顺序组成的第二向量矩阵;

16、将第二向量矩阵输入神经网络模型,以使神经网络模型学习各第二分词在各上下文第二分词前后出现的概率,以获取通用词嵌入矩阵模型。

17、进一步地,使用历史政务工单对通用词嵌入矩阵模型进行迁移学习,以获取政务工单专用词嵌入矩阵模型,具体包括:

18、获取历史政务热线工单数据集;

19、获取历史政务热线工单数据集的第三分词;

20、获取第三分词基于中文词汇的第三独热编码;

21、获取由第三独热编码按照第三分词在历史政务热线工单数据集中的前后顺序组成的第三向量矩阵;

22、将第三向量矩阵划分为训练集和验证集,并设置迁移学习的epoch次数和学习率衰减策略;

23、根据epoch次数和学习率衰减策略,使用训练集和验证集对通用词嵌入矩阵模型进行迁移学习,以根据学习到的各第三分词在各上下文第三分词前后出现的概率的准确率指标达到预设条件,获取政务工单专用词嵌入矩阵模型。

24、进一步地,对第二政务工单专用词嵌入矩阵中的代表性偏见词进行除偏处理,以获取第一政务工单专用词嵌入矩阵,具体包括:

25、获取某种指定歧视类型的一对代表性偏见对比词;

26、分别获取一对代表性偏见对比词在第二政务工单专用词嵌入矩阵中的第四词嵌入向量和第五词嵌入向量;

27、获取第二政务工单专用词嵌入矩阵中与第四词嵌入向量和第五词嵌入向量相似度最大的各n个第六词嵌入向量和第七词嵌入向量;

28、根据第四词嵌入向量、第五词嵌入向量、第六词嵌入向量和第七词嵌入向量,获取指定歧视类型的均衡化词嵌入向量;

29、利用均衡化词嵌入向量代替第四词嵌入向量、第五词嵌入向量、第六词嵌入向量和第七词嵌入向量,以消除第二政务工单专用词嵌入矩阵中的某种指定歧视类型;

30、在消除了第二政务工单专用词嵌入矩阵中的全部指定歧视类型后,获取到第一政务工单专用词嵌入矩阵。

31、进一步地,将第一词嵌入矩阵输入情感分析模型,以获取待分析政务工单的情感风险,具体包括:

32、将第一词嵌入矩阵输入情感分析模型,以使情感分析模型根据第一词嵌入矩阵中的第一代表性情感词嵌入向量与预先收集的强烈情感风险短句的第二代表性情感词嵌入向量的相似度,分析待分析政务工单是否存在强烈情感风险。

33、进一步地,将第一词嵌入矩阵输入情感分析模型之前,所述方法还包括:

34、对历史政务热线工单数据集打标,以获取包括预设数量个第二代表性情感词的强烈情感风险短句,并组建强烈情感风险短句库;

35、根据第一政务工单专用词嵌入矩阵,获取历史政务热线工单数据集中每个第三分词的第三词嵌入向量,根据第三词嵌入向量组成第三词嵌入矩阵;

36、根据第一政务工单专用词嵌入矩阵,获取强烈情感风险短句库中每个第二代表性情感词的第二代表性情感词嵌入向量,根据第二代表性情感词嵌入向量组成第二代表性情感词嵌入矩阵;

37、将第三词嵌入矩阵和第二代表性情感词嵌入矩阵输入融合稀疏自注意力的孪生神经网络模型进行相似度训练,以使孪生神经网络模型根据第三词嵌入矩阵输出与第二代表性情感词嵌入向量相似度达到第一阈值的第三代表性情感词嵌入向量,以获取情感分析模型。

38、进一步地,将第一词嵌入矩阵输入情感分析模型,以使情感分析模型根据第一词嵌入矩阵中的第一代表性情感词嵌入向量与预先收集的强烈情感风险短句的第二代表性情感词嵌入向量的相似度,分析待分析政务工单是否存在强烈情感风险,具体包括:

39、将第一词嵌入矩阵输入基于融合稀疏自注意力的孪生神经网络模型构建的情感分析模型的一侧网络,以使所述一侧网络输出预设数量个第一代表性情感词嵌入向量;

40、根据强烈情感风险短句库获取由第二代表性情感词嵌入向量组成的第二代表性情感词嵌入矩阵,将第二代表性情感词嵌入矩阵输入基于融合稀疏自注意力的孪生神经网络模型构建的情感分析模型的另一侧网络,以使所述另一侧网络输出预设数量个第二代表性情感词嵌入向量;

41、情感分析模型获取预设数量个第一代表性情感词嵌入向量的第一平均词嵌入向量和预设数量个第二代表性情感词嵌入向量的第二平均词嵌入向量,响应于第一平均词嵌入向量与第二平均词嵌入向量的相似度大于第二阈值,输出待分析政务工单存在强烈情感风险的预警信息。

42、第二方面,本公开提供一种政务工单情感风险分析装置,所述装置包括:

43、专用数据模块,用于获取第一政务工单专用词嵌入矩阵,第一政务工单专用词嵌入矩阵中包括携带了各分词在历史政务工单中出现信息的、除偏后的词嵌入向量;

44、待分析数据模块,与专用数据模块连接,用于根据第一政务工单专用词嵌入矩阵,获取待分析政务工单中每个第一分词的第一词嵌入向量,根据第一词嵌入向量组成第一词嵌入矩阵;

45、情感分析模块,与待分析数据模块连接,用于将第一词嵌入矩阵输入情感分析模型,以获取待分析政务工单的情感风险。

46、第三方面,本公开提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被处理器运行时,实现如上所述的政务工单情感风险分析方法。

47、本公开提供一种政务工单情感风险分析方法、政务工单情感风险分析装置以及计算机可读存储介质,通过政务工单专用词嵌入矩阵,获取待分析政务工单的第一词嵌入矩阵,根据第一词嵌入矩阵实现政务工单的情感风险分析,提高了针对政务工单情感分析的准确性。

本文地址:https://www.jishuxx.com/zhuanli/20241009/308162.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。