技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于RNN语音识别的实时语音风控系统的制作方法  >  正文

一种基于RNN语音识别的实时语音风控系统的制作方法

  • 国知局
  • 2024-06-21 10:42:16

本发明涉及语音识别,特别涉及一种基于rnn语音识别的实时语音风控系统。

背景技术:

1、随着信息技术的迅猛发展和通讯技术的普及,语音通信已成为人们重要的沟通方式之一,越来越多的人开始使用语音对话进行沟通和交流。然而,一些不法分子可能会利用语音通信进行欺诈、诈骗等违法犯罪活动,给社会安全和个人财产造成重大威胁,给互联网的通话风险检测也带来了一些风险和挑战,传统的文字风险检测已经无法满足风险检测需求,如何快速准确地识别和分析语音内容,成为当前亟待解决的问题,因此本发明提出一种基于rnn语音识别的实时语音风控系统。

技术实现思路

1、本发明提供一种基于rnn语音识别的实时语音风控系统,通过语音识别以及风险检测实现了语音通讯的自动检测,并自动将语音通讯内容与文字通讯内容进行结合,实现了通讯过程的完整检测,有利于及时发现当前通讯中的隐藏套路,帮助用户及时识别并发现潜在风险,降低用户受骗概率,保护用户的利益和安全,可以及时发现泄密行为,降低事件的泄露几率,提高信息安全。

2、本发明提供一种基于rnn语音识别的实时语音风控系统,包括:

3、语音检测模块,用于采集当前用户当前通讯的双向通讯语音,并进行预处理后获得有效双向通讯语音;

4、语音处理模块,用于基于rnn语音识别模型对双向通讯语音进行识别整理,获得双向通讯文本,并提取双向通讯文本的文本语义特征以及关联语义特征;

5、风险检测模块,用于基于文本语义特征以及关联语义特征对用户的当前通讯进行风险检测,并根据风险检测结果,生成对应的风险控制信号;

6、风险控制模块,用于基于风险控制信号,对当前通讯进行对应的风控处理。

7、优选的,在一种基于rnn语音识别的实时语音风控系统中,语音检测模块,包括:

8、语音采集单元,用于当前用户当前通讯双方的语音进行采集,获得双向通讯语音;

9、预处理单元,用于基于双向通讯语音的接听关系,将双向通讯语音进行分组,获得第一语音和第二语音,并分别对第一语音和第二语音进行预处理。

10、优选的,在一种基于rnn语音识别的实时语音风控系统中,预处理单元,包括:

11、语音降噪子单元,用于基于预设算法对应第一语音以及第二语音进行语音降噪,获得第一去噪语音和第二去噪语音;

12、语音分离子单元,用于获取当前第一语音对应的多个第一历史语音,基于第一历史语音进行语音特征提取,获得第一参考特征并发送至第一参考特征列表进行存储,根据第一参考特征对第一语音进行人声净化,获得第一有效语音;

13、获取当前第二语音对应的多个第二历史语音,基于第二历史语音进行语音特征提取,获得第二参考特征并发送至第二参考特征列表进行存储,根据第二参考特征对第二语音进行人声净化,获得第二有效语音;

14、语音发送单元,用于将第一有效语音和第二有效语音作为有效双向通讯语音,发送至语音处理模块。

15、优选的,在一种基于rnn语音识别的实时语音风控系统中,语音分离子单元,包括:

16、参考更新子单元,用于获取预设时间内的多条单方通讯语音对应的语音特征,并与其对应的参考特征列表中的参考特征进行对比,判断单方通讯语音人声是否存在语音异常;

17、其中,单方通讯语音为第一语音或者第二语音;

18、当单方通讯语音人声存在语音异常时,将与其对应的参考特征不一样的单方通讯语音作为异常语音,计算同一类型异常语音在预设时间段内的使用频率,基于所述使用频率,预测异常语音的使用连续程度;

19、当使用连续程度大于预设值时,判定异常语音为常用语音,将常用语音对应的语音特征作为参考特征,并对单方通讯语音对应的参考特征列表进行更新;

20、否则,判定异常语音为非常用语音。

21、优选的,在一种基于rnn语音识别的实时语音风控系统中,语音处理模块,包括:

22、语音识别单元,用于基于rnn语音识别模型对有效双向通讯语音进行识别,获得语音识别结果,并结合当前通讯中的文字对话,生成双向通讯文本;

23、第一提取单元,用于基于双向通讯语音的接听关系,将双向通讯文本进行文本分组,获得第一文本组和第二文本组,并对分别对第一文本组和第二文本组进行提取,获得文本语义特征;

24、第二提取单元,用于对双向通讯文本进行对话逻辑识别,并基于对话逻辑识别结果,对双向通讯文本进行顺序整理,获得整理文本,并将整理文本与双向通讯文本进行对比,获得关联语义特征。

25、优选的,在一种基于rnn语音识别的实时语音风控系统中,第二提取单元,包括:

26、逻辑识别子单元,用于按照原对话顺序,通过rnn语音识别模型对双向通讯文本进行语义识别,根据语义识别结果,分别确定当前通讯中的多个对话话题的话题首句,基于对话问答特征以及话题首句关键词,对当前剩余文本语句与各个话题首句的相关性进行判断,根据判断结果,确定每个对话话题对应的全部通讯文本,得到双向通讯文本的对话逻辑;

27、文本整理子单元,用于基于所述对话逻辑,对双向通讯文本进行顺序调整,将同一对话话题对应的全部通讯文本调整成连续对话文本,获得多个双向通讯文本段,并基于原对话中各个对话话题的出现顺序,对多个双向通讯文本段进行拼接形成完整的新双向通讯文本,获得整理文本;

28、特征提取子单元,用于将整理文本与双向通讯文本进行对比,确定双向通讯语音中的对话话题穿插关系以及对话话题更换频率,基于对话话题穿插关系以及对话话题更换频率,生成关联语义特征。

29、优选的,在一种基于rnn语音识别的实时语音风控系统中,风险检测模块,包括:

30、第一检测单元,用于将独立通讯文本的文本语义特征与预设风险列表中的多个风险词汇对应的语义特征进行对比,若文本语义特征与任意风险词汇对应的语义特征相同时,判定所述文本语义特征对应的独立通讯文本为疑似风险文本;

31、并截取疑似风险文本所在的双向通讯文本段,获取所述双向通讯文本段对应的关联语义特征,提取对话情景关键词,基于对话情景关键词,确定疑似风险文本的对话情景,参考预设风险列表,判断疑似风险文本的对话情景与其对应的风险词汇的风险情景是否匹配;

32、若匹配,则判定疑似风险文本为风险文本,并生成第一控制信号;

33、若不匹配,则判定疑似风险文本为正常语音;

34、第二检测单元,用于基于关联语义特征,确定当前通讯的对话话题切换复杂程度,当对话话题切换复杂程度大于预设值时,判断当前通讯是否为多方对话,若是,判断当前通讯正常;

35、否则,判定当前通讯异常,并将当前通讯对应的整理文本发送至风险确定单元;

36、风险确定单元,用于判断当前通讯是否存在敏感话题,若存在,则判定当前通讯为风险通讯,生成第二控制信号;

37、若不存在,则向当前通讯添加可疑标签,基于关联语义特征,确定当前通讯对应的当前对话架构,将当前对话构架与多方对话风险判断参考列表中的风险构架进行对比,若当前对话构架与任意风险构架相同,则判定当前通讯为风险通讯,并生成第二控制信号;

38、否则,将当前通讯对应的双向通讯文本发送至管理端等待人工判定。

39、优选的,在一种基于rnn语音识别的实时语音风控系统中,风险控制模块,包括:

40、信号识别单元,用于对接收到的风险控制信号进行类型识别;

41、第一控制单元,用于在确定接收到的风险控制信号为第一控制信号时,对存在风险的语音或者文本进行拦截并限制发送权限,生成风险控制日志,并获取当前通讯中风险文本的占比,当所述占比到达阈值时,生成第二控制信号;

42、第二控制单元,用于在确定接收到的风险控制信号为第二控制信号时,终止当前通讯并生成风险报警信号发送至管理端,并对当前通讯对应的双向通讯文本进行保存存储,生成风险控制日志。

43、优选的,在一种基于rnn语音识别的实时语音风控系统中,风险确定单元,还包括:

44、结果获取子单元,用于采集带有可疑标签的当前通讯的人工判定结果;

45、标签修改子单元,用于当人工判定当前通讯存在风险时,将当前通讯对应的标签修改为风险标签,并生成第二控制信号;

46、当人工判定当前通讯不存在风险时,当前通讯对应的标签修改为正常标签;

47、列表更新子单元,用于获取多个从可疑标签修改为风险标签的通讯记录,基于通讯记录对应的对话话题切换复杂程度对通讯记录进行分类,获得多个记录集合,分别对每个记录集合中多个通讯记录对应的关联语义特征进行对比,确定不同对话话题切换复杂程度对应的风险对话架构,基于所述风险对话构架对多方对话风险判断参考列表进行更新。

48、优选的,在一种基于rnn语音识别的实时语音风控系统中,还包括:模型训练模块,用于对rnn识别模型进行训练得到rnn语音识别模型,包括:

49、样本采集单元,用于获取多种风险词汇以及风险词汇相似词汇的风险文本,以及所述风险文本对应的多种方言语音,并将所述风险文本和方言语音作为训练语音;

50、第一处理单元,用于根据训练语音中包含的风险词汇的分类,将训练语音进行分组,获得多个风险训练组;

51、模型训练模块,用于基于风险训练组生成训练集,对rnn识别模型进行训练,获得rnn语音识别模型。

52、与现有技术相比,本发明至少存在以下有益效果:

53、本发明通过语音检测模块采集用户当前通讯的双向通讯语音,并进行预处理后获得有效双向通讯语音,实现对通话语音采集以及处理,有效提高语音识别的准确性;通过语音处理模块基于rnn语音识别模型对双向通讯语音进行识别整理,获得双向通讯文本,并提取有效双向通讯语音的文本语义特征以及关联语义特征;然后通过风险检测模块基于文本语义特征以及关联语义特征对用户的当前通讯进行风险检测,并根据风险检测结果,生成对应的风险控制信号,完成对语音对话的智能检测以及风险分类有助于快速确定风险文本的控制方式,最后通过风险控制模块基于风险控制信号,对当前通讯进行对应的风控处理,实现了风险对话的自动出。本发明通过语音识别以及风险检测实现了语音通讯的自动检测,并自动将语音通讯内容与文字通讯内容进行结合,实现了通讯过程的完整检测,有利于及时发现当前通讯中的隐藏套路,帮助用户及时识别并发现潜在风险,降低用户受骗概率,保护用户的利益和安全,同时,对用户通讯语音进行检测也有利于及时发现泄密行为,降低事件的泄露几率,提高信息安全。

54、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在本技术文件中所特别指出的结构来实现和获得。

55、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

本文地址:https://www.jishuxx.com/zhuanli/20240618/21347.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。