技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音检测方法、语音检测系统、电子设备及存储介质与流程  >  正文

语音检测方法、语音检测系统、电子设备及存储介质与流程

  • 国知局
  • 2024-06-21 11:26:08

本公开涉及语音检测领域,可应用于金融领域或其他领域,尤其涉及一种语音检测方法、语音检测系统、电子设备及存储介质。

背景技术:

1、在服务业领域,办理某项业务时,通常需要判断一下业务人员是否完整的按照正确的流程办理业务。因此需要有流程合规检查,辅助判断业务人员是否出现遗漏步骤、顺序错误的情况。

2、目前,通常会通过语音检测的方式来判断流程是否合规。即,通过将业务人员的语音转化成检测文本,再基于参考话术对检测文本进行语义相似度的检测。然而,这种方法容易造成误判。

技术实现思路

1、本公开提出一种语音检测方法、装置、电子设备、存储介质和计算机程序产品。

2、根据本公开的一个方面,提供了一种语音检测方法,包括:获取语音所对应的待检测文本;对待检测文本中符合语义的词进行切分,获取第一词组;对待检测文本中所有可以组成词语的词进行切分,获取第二词组;将第一词组与参考文本进行相似度计算,得到语义相似度;将第二词组与参考关键词进行匹配,得到关键词匹配度;基于语义相似度以及关键词匹配度,确定语音是否满足预定条件。

3、根据本公开的实施例,确定语音是否满足预定条件包括:基于语义相似度以及关键词匹配度,在n个规范步骤中判断出待检测文本对应的当前步骤,并判断待检测文本是否符合当前步骤的参考话术规范,n≥1。

4、根据本公开的实施例,还包括:建立语料库,语料库中存储有对应于n个规范步骤的参考文本以及参考关键词,其中,n个规范步骤中的每一规范步骤具有至少一个参考文本以及至少一个参考关键词,基于语料库对第一词组进行相似度计算以及基于语料库对第二词组进行关键词匹配。

5、根据本公开的实施例,将第一词组与参考文本进行相似度计算,得到语义相似度的方法包括:基于语料库建立语义相似度模型;采用语义相似度模型将第一词组中的每一词语与n个规范步骤中的每一规范步骤的参考文本进行相似度计算,获取每一规范步骤对应的语义相似度。

6、根据本公开的实施例,将第二词组与参考关键词进行匹配,获取关键词匹配度的方法包括:将第二词组中的每一词语与n个规范步骤中的每一规范步骤的参考关键词一一比对,获取每一步骤对应的关键词匹配度。

7、根据本公开的实施例,将第二词组中的每一词语与n个规范步骤中的每一规范步骤的参考关键词一一比对,获取每一步骤对应的关键词匹配度包括:选取n个规范步骤中的其中一个规范步骤;将第二词组中的每一词语与该规范步骤中的所有参考关键词依次进行比对,获取比对相同的词语数量;将比对相同的词语数量除以该规范步骤中的参考关键词的总数量,得出该规范步骤对应的关键词匹配度。

8、根据本公开的实施例,在n个规范步骤中判断出待检测文本对应的当前步骤,并判断待检测文本是否符合当前步骤的参考话术规范包括:对n个规范步骤中的每一步骤对应的语义相似度以及关键词匹配度进行匹配计算,获取对应于n个规范步骤中的每一步骤的n个最终匹配分数;获取n个最终匹配分数中的最高值,最高值对应的步骤为当前步骤;判断最高值是否不小于预设标准值,若最高值不小于预设标准值,则判断当前步骤符合当前步骤的参考话术规范。

9、根据本公开的实施例,语义相似度在0~1之间,规范步骤中的参考关键词为m个,m≥1,匹配计算包括:设定预设阈值p,p为大于1的整数;若规范步骤中的参考关键词的数量小于p个,则最终匹配分数按照第一公式计算,第一公式为:语义相似度+关键词匹配度×m/p;若规范步骤中的参考关键词的数量不小于p个,则最终匹配分数按照第二公式计算,第二公式为:语义相似度+关键词匹配度。

10、根据本公开的实施例,p≥10。

11、根据本公开的实施例,获取第一词组以及第二词组的方法包括:采用jieba分词模型的精确模式对待检测文本进行分词以获取第一词组;采用jieba分词模型的全模式对待检测文本进行分词以获取第二词组。

12、根据本公开的实施例,在获取第一词组以及第二词组之前,还包括:判断待检测文本的字数是否大于预设字数阈值;若待检测文本的字数大于预设字数阈值,则判断待检测文本是否有实际意义;若判断待检测文本具有实际意义,则对待检测文本进行过滤,去除待检测文本中的停用词、标点、数字、英文和特殊字符

13、根据本公开的另一方面,提供了一种语音检测系统,包括:文本获取模块,用于获取语音所对应的待检测文本;第一分词模块,用于对待检测文本中符合语义的词进行切分,获取第一词组;第二分词模块,用于对待检测文本中所有可以组成词语的词进行切分,获取第二词组;语义相似度判断模块,用于将第一词组与参考文本进行相似度计算,获取语义相似度;关键词匹配判断模块,用于将第二词组与参考关键词进行匹配,获取关键词匹配度;计算模块,用于基于语义相似度以及关键词匹配度,确定语音是否满足预定条件。

14、根据本公开的另一方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行实现如上的语音检测方法。

15、根据本公开的另一方面,提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行实现如上的语音检测方法。

16、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现如上的语音检测方法。

17、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种语音检测方法,包括:

2.根据权利要求1所述的语音检测方法,其中,所述确定所述语音是否满足预定条件包括:

3.根据权利要求2所述的语音检测方法,其中,还包括:建立语料库,所述语料库中存储有对应于所述n个规范步骤的参考文本以及参考关键词,其中,所述n个规范步骤中的每一规范步骤具有至少一个参考文本以及至少一个参考关键词,基于所述语料库对所述第一词组进行相似度计算以及基于所述语料库对所述第二词组进行关键词匹配。

4.根据权利要求3所述的语音检测方法,其中,所述将所述第一词组与参考文本进行相似度计算,得到语义相似度的方法包括:

5.根据权利要求4所述的语音检测方法,其中,所述将所述第二词组与参考关键词进行匹配,获取关键词匹配度的方法包括:

6.根据权利要求5所述的语音检测方法,其中,将所述第二词组中的每一词语与所述n个规范步骤中的每一规范步骤的参考关键词一一比对,获取每一步骤对应的关键词匹配度包括:

7.根据权利要求6所述的语音检测方法,其中,所述在n个规范步骤中判断出所述待检测文本对应的当前步骤,并判断所述待检测文本是否符合所述当前步骤的参考话术规范包括:

8.根据权利要求7所述的语音检测方法,其中,所述语义相似度在0~1之间,所述规范步骤中的参考关键词为m个,m≥1,所述匹配计算包括:

9.根据权利要求8所述的语音检测方法,其中,p≥10。

10.根据权利要求1所述的语音检测方法,其中,获取所述第一词组以及所述第二词组的方法包括:

11.根据权利要求1-10中任一项所述的语音检测方法,其中,在获取所述第一词组以及所述第二词组之前,还包括:

12.一种语音检测系统,包括:

13.一种电子设备,包括:

14.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~11中任一项所述的方法。

15.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~11中任一项所述的方法。

技术总结本公开提供了一种语音检测方法、语音检测系统、装置、电子设备、及存储介质,可应用于金融领域或其他领域。语音检测方法包括:获取语音所对应的待检测文本;对待检测文本中符合语义的词进行切分,获取第一词组;对待检测文本中所有可以组成词语的词进行切分,获取第二词组;将第一词组与参考文本进行相似度计算,得到语义相似度;将第二词组与参考关键词进行匹配,得到关键词匹配度;基于语义相似度以及关键词匹配度,确定语音是否满足预定条件。技术研发人员:熊步先受保护的技术使用者:中国工商银行股份有限公司技术研发日:技术公布日:2024/2/6

本文地址:https://www.jishuxx.com/zhuanli/20240618/21503.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。