一种基于决策树的语音回复异常词汇检测与修正处理方法与流程
- 国知局
- 2024-06-21 11:47:59
本发明涉及智能硬件,尤其涉及一种基于决策树的语音回复异常词汇检测与修正处理方法和装置、电子设备。
背景技术:
1、由于语音的便捷性,智能语音交互已经成为连接人与智能设备的主要方式。人机对话技术旨在让机器通过与人类的对话交互,以更自然友好的方式帮助用户高效地完成任务,以及与用户进行情感沟通。智能设备能够“听懂”用户的语言,执行相应的指令或者进行合理的回复。
2、自然语言生成(natural language generation,nlg)是自然语言处理领域一个重要的组成部分,实现高质量的自然语言生成也是人工智能迈向认知智能的重要标志。在人机对话中,生成回复语句之余,还需要注意识别异常词语音信息,避免网络安全问题。因此,目前迫切需要本领域技术人员提供一种可以对回复语句中的异常词进行规避处理的方案。
技术实现思路
1、本发明实施例的目的是提供一种基于决策树的语音回复异常词汇检测与修正处理方法和装置、电子设备,能够解决目前无法在人机交互过程中对回复语句中的异常词进行规避处理的问题。
2、为解决上述技术问题,本发明提供如下技术方案:
3、本发明实施例提供了一种基于决策树的语音回复异常词汇检测与修正处理方法,其中,所述方法包括:
4、对获取的语音输入进行语义解析,提取出目标场景关键词;
5、基于所述目标场景关键词,生成初始回复语句;
6、基于预先创建的决策树对所述初始回复语句进行异常词检测;
7、按照第一预设规则对检测到的异常词进行修正处理,得到目标回复语句;
8、输出所述目标回复语句。
9、可选地,所述基于所述目标场景关键词,生成初始回复语句的步骤,包括:
10、从所述目标场景关键词对应的语料库中搜索回复语句;
11、若未搜索到回复语句,则将所述语音输入转换成文字信息输入预训练的自然语言生成模型中,生成初始回复语句;
12、若搜索到回复语句,则将搜索到的回复语句确定为初始回复语句。
13、可选地,所述决策树通过如下方式生成:
14、建立根节点;
15、建立根节点关联的各分支节点,其中,每个分支节点对应一个字符;
16、将异常词库中的异常词按照首字、首字母划分至各所述分支节点下;
17、针对每个所述分支节点,按照第二预设规则将所述分支节点下的异常词划分至至少一个子分支层级下,生成决策树。
18、可选地,所述决策树下各子分支层级包含的各子分支节点下包含所述分支节点对应的汉字的关联信息,其中,关联信息包括:拼音、繁体字以及谐音字中的至少一种。
19、可选地,所述基于预先创建的决策树对所述初始回复语句进行异常词检测的步骤,包括:
20、对所述初始回复语句进行分词,得到多个分词;
21、针对每个所述分词,判断预先创建的决策树中管理的异常词中是否存在与所述分词匹配的异常词;
22、若存在与所述分词匹配的异常词,判断所述初始回复语句中是否存在所述分词的语义修正词;
23、若不存在所述分词的语义修正词,则将所述分词确定为异常词。
24、可选地,所述决策树包含的每个异常词均对应有异常类别和敏感度。
25、可选地,基于预先创建的决策树对所述初始回复语句进行异常词检测的步骤,包括:
26、对所述初始回复语句进行分词,得到多个分词;
27、从预先创建的决策树中查找与所述分词匹配的目标异常词;
28、基于预设的各业务场景与待修正异常词的异常类别、敏感度关联关系,当前业务场景以及各所述目标异常词对应的异常类别和敏感度,从各所述目标异常词中筛选出待修正的异常词。
29、本发明实施例还提供了一种基于决策树的语音回复异常词汇检测与修正处理装置,其中,所述装置包括:
30、提取模块,用于对获取的语音输入进行语义解析,提取出目标场景关键词;
31、生成模块,用于基于所述目标场景关键词,生成初始回复语句;
32、检测模块,用于基于预先创建的决策树对所述初始回复语句进行异常词检测;
33、修正模块,用于按照第一预设规则对检测到的异常词进行修正处理,得到目标回复语句;
34、输出模块,用于输出所述目标回复语句。
35、可选地,所述生成模块包括:
36、第一子模块,用于从所述目标场景关键词对应的语料库中搜索回复语句;
37、第二子模块,用于若未搜索到回复语句,则将所述语音输入转换成文字信息输入预训练的自然语言生成模型中,生成初始回复语句;
38、第三子模块,用于若搜索到回复语句,则将搜索到的回复语句确定为初始回复语句。
39、可选地,所述决策树通过如下方式生成:
40、建立根节点;
41、建立根节点关联的各分支节点,其中,每个分支节点对应一个字符;
42、将异常词库中的异常词按照首字、首字母划分至各所述分支节点下;
43、针对每个所述分支节点,按照第二预设规则将所述分支节点下的异常词划分至至少一个子分支层级下,生成决策树。
44、可选地,所述决策树下各子分支层级包含的各子分支节点下包含所述分支节点对应的汉字的关联信息,其中,关联信息包括:拼音、繁体字以及谐音字中的至少一种。
45、可选地,所述检测模块包括:
46、第四子模块,用于对所述初始回复语句进行分词,得到多个分词;
47、第五子模块,用于针对每个所述分词,判断预先创建的决策树中管理的异常词中是否存在与所述分词匹配的异常词;
48、第六子模块,用于若存在与所述分词匹配的异常词,判断所述初始回复语句中是否存在所述分词的语义修正词;若不存在所述分词的语义修正词,则将所述分词确定为异常词。
49、可选地,所述决策树包含的每个异常词均对应有异常类别和敏感度。
50、可选地,所述检测模块具体用于:
51、对所述初始回复语句进行分词,得到多个分词;
52、从预先创建的决策树中查找与所述分词匹配的目标异常词;
53、基于预设的各业务场景与待修正异常词的异常类别、敏感度关联关系,当前业务场景以及各所述目标异常词对应的异常类别和敏感度,从各所述目标异常词中筛选出待修正的异常词。
54、本发明实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现上述任意一种基于决策树的语音回复异常词汇检测与修正处理方法的步骤。
55、本发明实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现上述任意一种基于决策树的语音回复异常词汇检测与修正处理方法的步骤。
56、本发明实施例提供的基于决策树的语音回复异常词汇检测与修正处理方案,对获取的语音输入进行语义解析,提取出目标场景关键词;基于目标场景关键词,生成初始回复语句;基于预先创建的决策树对初始回复语句进行异常词检测;按照第一预设规则对检测到的异常词进行修正处理,得到目标回复语句;输出目标回复语句。通过本发明实施例提供的基于决策树的语音回复异常词汇检测与修正处理方案,基于包含大量异常词的决策树识别出异常词并对异常词进行修正处理,能够精准地对初始回复语句中的异常词进行规避,提升网络安全性。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23626.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表