技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于Bert模型的银行用智能机器人工作方法及系统与流程  >  正文

一种基于Bert模型的银行用智能机器人工作方法及系统与流程

  • 国知局
  • 2024-10-09 15:10:30

本发明涉及智能机器人,尤其是涉及一种基于bert模型的银行用智能机器人工作方法及系统。

背景技术:

1、随着科技的进步,越来越多的银行开始使用具有语音交互功能的智能机器人。将智能机器人布设在银行大厅时,前来办理业务的客户便可以自助与智能机器人进行语音交互,从而快速获得有关业务办理的相关信息,可提升银行的业务办理效率。但是,现有的智能机器人都是基于内置的预设应答数据集来确定应答内容,应答数据集未根据当前实际银行业务员与客户之间的交互语音来设定,由于银行业务的时变性,会导致出现与客户需求的应答内容缺失的问题,并且现有应答数据集的更新也较慢,另外更新的数据也是通过预设来确定,不能因银行业务的时变性而及时调整更新时长以及合适的更新数据,导致应答内容准确性低,降低客户业务办理效率。

技术实现思路

1、本发明主要是解决现有银行智能机器人出现与客户需求的应答内容缺失,应答数据更新慢,不能动态调节更新时长和更新内容,降低应答准确性的问题,提供了一种基于bert模型的银行用智能机器人工作方法及系统。

2、本发明的上述技术问题主要是通过下述技术方案得以解决的:一种基于bert模型的银行用智能机器人工作方法,包括以下步骤:

3、获取银行业务数据,根据银行业务数据对模型进行训练和预测,获得应答数据集,应答数据集包括相关联配对的语音特征模板数据和目标应答数据;

4、实时获取客户交互语音,使用bert模型获取语音特征数据,将语音特征数据与应答数据集进行匹配,确定目标应答内容输出应答语音;

5、分析应答语音无效情况来调节周期时长,在调节后周期内采集银行业务数据对应答数据集进行更新。

6、本发明根据收集到的真实银行业务数据来训练深度预测模型,并使用深度预测模型构建得出应答数据集,智能机器人通过使用应答数据集以获取最合适的目标应答内容,从而可以向客户输出最符合客户需求的语音,提高了客户业务办理的效率。本发明能够通过分析应答内容的无效性来调节更新时间和采集银行业务数据时长,缩短更新时间和采集更接近的历史银行业务数据来进行应答数据集的更新,从而提升应答准确性,解决了出现与客户需求应答内容缺失的问题。

7、作为一种优选方案,所述的获得应答数据集,具体包括:

8、使用训练数据对深度预测模型进行训练,根据训练后的深度预测模型对测试数据进行预测分析,获得应答数据集。

9、本方案将获得的银行业务数据分别创建训练数据和测试数据,采用训练数据对深度预测模型进行训练,然后采用测试数据对训练后的深度预测模型进行预测分析,获得做种的应答数据集,应答数据集中包含了关联配对的语音特征模版数据和目标应答数据,通过输入交互语音的语音特征数据,能够计算输出合适的目标应答内容,合适的目标应答内容包括一个或多个,多个则按照合适优先级排序后按优先级进行输出,在获得目标应答内容后转换成目标应答语音进行输出。

10、作为一种优选方案,获取的银行业务数据包括第一银行业务数据和第二银行业务数据,根据第一银行业务数据构建训练数据,训练数据包括经语音翻译的交互语音数据和标记的应答内容,根据第二银行业务数据构建测试数据。

11、获取的银行业务数据分为两份,即第一银行业务数据和第二银行业务数据,其中使用第一银行业务数据来构建深度预测模型的训练数据,训练数据中包含了经过语音翻译的交互语音数据和已标记的应答内容,应答内容预先通过人工或机器方式进行标记。使用第二银行业务数据构建测试数据,第二银行业务数据包括未标记应答内容。在使用第一银行业务数据对深度预测模型进行足够的训练后,再使用训练后的深度预测模型对未标记的第二银行业务数据进行深度分析,从而可以获得应答数据集。

12、作为一种优选方案,所述第一银行业务数据和第二银行业务数据包括按照周期采集到的指定时长内的银行人工柜台内外的交互语音数据,指定时长根据智能机器人所处银行上一个周期业务政策文件的接收情况确定。

13、第一银行业务数据和第二银行业务数据需要在周期内采集指定时长内的银行人工柜台内外的交互语音数据,用于训练数据的构建和应答数据集确定的基础数据,即从实际业务办理过程中银行业务员与客户之间的交流对话来深度挖掘客户的交互语音数据和对应的应答内容之间的配对关系。由于银行业务的时变性较强,需要确定合适的应答数据集的更新周期以及更新所依据的数据,其中更新周期即通过周期来确定,而确定合适的更新所依据的数据通过指定时长来调节,指定时长根据智能机器人所处银行上一个周期业务政策文件的接收情况确定,根据收到业务政策文件的频率,判定相关业务政策出现变动,根据变动的状态则需要调节指定时长,使用距离当前更近或更多的银行业务员与客户之间的历史交流对话来进行应答数据集的更新,从而提升应答准确性,解决了出现与客户需求应答内容缺失的问题。

14、作为一种优选方案,所述的分析应答语音无效情况来调节周期时长,具体包括:

15、交互语音包括客户输入的第一交互语音,应答语音包括智能机器人响应第一交互语音输出的第一应答语音;

16、在输出第一应答语音后,实时检测客户是否输入第二交互语音,所述第二交互语音为包含第一交互语音中语音特征数据的交互语音,

17、在检测到客户输入第二交互语音,统计第二交互语音输入次数,以及获取智能机器人应答上一个第二交互语音输出的第二应答语音,计算该第二交互语音与第二应答语音的重合度值;根据输入次数和重合度值计算得到关于第一应答语音无效的评估值,根据评估值生成干预系数,通过干预系数调节周期大小。

18、本方案设置智能机器人在向客户输出针对客户的第一交互语音的第一应答语音之后,继续检测该客户是否又向智能机器人输入了包含相同语音特征数据的第二交互语音,通过统计与第二交互语音相关的输入次数和重合度值,据此计算出关于第一应答语音无效的评估值。评估值判定智能机器人输出的第一应答语音是否满足客户的需求,预设评估值设定值,在评估值大于设定值时,智能机器人输出的第一应答语音不能满足客户的需求(例如客户认为该信息不够准确,因而客户重复输入包含了第一交互语音的语音特征数据的第二交互语音,以对智能机器人进行再次询问),则生成干预系数,使用干预系数来调节周期大小,该干预系数与评估值为负相关关系,例如1/评估值,评估值越大则表示第一应答语音无效性越大,通过干预系数以减少周期的时间,同时评估值也是确定应答数据集是否存在错误或无效数据。本方案通过分析客户对于智能机器人的应答语音的满意程度,进而分析前述确定的应答数据集是否存在错误或无效数据,具体的为通过检测客户重复输入包含了第一交互语音的语音特征数据的第二交互语音相关的输入次数和重合度值,计算评估值判断用户对智能机器人应答语音满意程度,然后通过干预系数来调节周期时长,进而适当缩短应答数据的更新周期,更新周期即为周期,以使用最新的政策数据来更新应答数据集。

19、作为一种优选方案,所述重合度值为智能机器人应答上一个第二交互语音输出的第二应答语音,与客户输入的与上一个第二交互语音相邻的下一个第二交互语音的时间重合度值。

20、重合度值为时间重合度值,该重合度值表征了客户打断智能机器人应答上一个第二交互语音的程度,也是反映了客户对于智能机器人的最新应答语音的认可程度。智能机器人在应答上一个第二交互语音输出第二应答语音,该第二应答语音输出包括输出所需时间,在当前第二应答语音输出过程中客户又重复输入了第二交互语音,当前第二交互语音与当前第二应答语音存在时间重合,计算出的重合时间即为重合度值。

21、作为一种优选方案,所述的根据输入次数和重合度值计算得到关于第一应答语音无效的评估值,具体包括:

22、

23、其中,ass为关于第一应答语音无效的评估值,α为小于1的基础系数,β为大于1的浮动系数,与n正相关,n为输入次数,f(n)为输入次数的归一化处理数值,d为重合度值,f(d)为重合度值归一化处理数值,nthreshold为输入次数的阈值。

24、本方案中根据输入次数与阈值的比较,在输入次数小于阈值的情况下,评估值为输入次数归一化处理数值和重合度值归一化处理数值的和值,与基础系数的乘积;在输入次数不小于阈值的情况下,评估值为输入次数归一化处理数值和重合度值归一化处理数值的和值,与基础系数和浮动系数的和值的乘积。

25、本发明通过评估值ass公式对输入次数和重合度值进行综合处理,从而获得能够反映客户对于第一应答语音无效的态度,进而间接分析应答数据集中的目标应答内容为无效的概率。公式中以第二交互语音的输入次数阈值nthreshold为分隔节点,在第二交互语音的输入次数低于nthreshold时,以基础系数α和输入次数与重合度值的归一化处理数值的和值的乘积作为评估值。在第二交互语音的输入次数不低于nthreshold时,则增加了浮动系数β,而且β与n的值正相关,即输入次数越多,则β值越大,这样可以在输入次数逐渐增多即客户不满意度快速增加时,使得评估值得以更快的增大,从而更快的得出与第一应答语音无效的评断结论。

26、作为一种优选方案,所述的在调节后周期内采集银行业务数据对应答数据集进行更新,具体包括:

27、按照调节后的周期时长,在新周期内根据指定时长获取第三银行业务数据,判断第三银行业务数据是否包含与第一交互语音中语音特征数据相关的内容;

28、若包含,则根据第三银行业务数据对当前应答数据集进行更新;若不包含,则获取指定范围内其他银行的其他智能机器人的应答数据集,使用获取的应答数据集对当前应答数据集进行更新。

29、通过对第一应答语音无效的分析可以确定出新的周期时长即更新周期时长,这样可以适当的提前对应答数据集进行更新。在进入新周期后在指定时长内获取第三银行业务数据,第三银行业务数据包含人工柜台内外的交互语音数据。在使用第三银行业务数据前还需进行是否包含与第一交互语音中语音特征数据的判断。在第三银行业务数据包含第一交互语音中语音特征数据,则直接使用该第三银行业务数据,根据深度预测模型对第三银行业务数据进行预测分析,获得新的应答数据集,包括重新确定的语音特征模板数据和目标应答内容的配对关系。使用新的应答数据集对当前应答数据集的至少一部分进行更新,即仅对涉及变更的部分数据进行更新,未涉及变更的数据使用老数据。在第三银行业务数据不包含第一交互语音中语音特征数据,则使用该第三银行业务数据还不能解决与第一交互语音对应无效的目标应答内容的纠正,此时获取指定范围内其他银行的其他智能机器人的应答数据集,使用该应答数据集对当前应答数据集的至少一部分进行更新。由于银行内某项政策被指定之后下发至各个银行会因某些因素导致银行的接收时间存在偏差,或者银行的智能机器人与银行内部信息系统的数据共享周期较长,导致智能机器人未及时获得最新的政策数据,于是通过借助地区内的其他银行的智能机器人的应答数据集来更新自身的应答数据集,可以间接完成对信息的及时获取,进而获得更新的目标应答数据集。

30、作为一种优选方案,指定时长的确定包括:

31、预设指定时长;

32、在本周期内实时获取政策文件接收频率,计算本周期政策文件接收频率与上一个周期政策文件接收频率的比值;

33、预设比值范围与调节系数的对应关系,根据比值所在范围获取调节系数,根据调节系数与预设指定时长的乘积获得当前周期指定时长。

34、指定时长为根据智能机器人所处银行上一个周期业务政策文件的接收情况确定,智能机器人在指定时长内对银行人工柜台内外的交互语音数据进行采集。首先要初步预设指定时长t0,如预设指定时长t0为30天,即获取自当前时刻起30天内的银行业务员与客户之间的历史交流对话数据,以分析得出应答数据集。根据上一周期政策文件接收数量来统计接收频率f0,采用f=n/t进行计算,其中n为接收政策文件数量,t为经历时长。实时统计本周期内政策文件接收频率f1,计算本周期政策文件接收频率与上一个周期政策文件接收频率的比值f1/f0。并且预设比值范围与调节系数的对应关系,比值与调节系数负相关,将比值与预设比值范围进行比较,来确定对应的调节系数,计算出当前指定时长,表示如下:

35、当f1/f0<0.6,ta=t0*1.5

36、当0.6≤f1/f0<0.9,ta=t0*1.2

37、当0.9≤f1/f0<1.2,ta=t0

38、当1.2≤f1/f0<1.8,ta=t0*0.8

39、当1.8≤f1/f0,ta=t0*0.6

40、其中ta为当前指定时长,0.6-1.5为调节系数,使用该调节系数与初步预设的指定时长ta进行乘运算,从而得出更长或更短的指定时长。根据上述表达式可知随着接收政策文件频率的降低,将拉长指定时长,随着接收政策文件频率的升高,则缩短指定时长。本发明在监测到银行高频率收到业务政策文件时,判定相关业务政策出现变动,则需要缩短指定时长,即使用距离当前更近的银行业务员与客户之间的历史交流对话来进行应答数据集的更新,从而提升应答准确性。

41、一种基于bert模型的银行用智能机器人系统,包括:

42、通信模块:获取银行业务数据,传输给处理模块;

43、语音监听模块:获取客户针对智能机器人的交互语音,传输给处理模块;

44、处理模块:根据银行业务数据对模型进行训练和预测,获得应答数据集,根据交互语音的语音特征数据与应答数据集进行匹配,确定目标应答内容输出应答语音;分析应答语音无效情况来调节周期时长,在调节后周期内采集银行业务数据对应答数据集进行更新。

45、通信模块、语音监听模块分别与处理模块连接,智能机器人系统还包括存储模块,存储模块用于存储计算机程序,存储模块与处理模块相连,处理模块用于调取并执行存储模块中的计算机程序,以执行如前述的方法,获取应答数据集,根据应答数据集确定出于交互语音对应的应答语音,并且通过分析应答语音无效情况对应答数据集进行更新。

46、因此,本发明的优点是:

47、1.根据收集到的真实银行业务数据来训练深度预测模型,并使用深度预测模型构建得出应答数据集,智能机器人通过使用应答数据集以获取最合适的目标应答内容,从而可以向客户输出最符合客户需求的语音,提高了客户业务办理的效率。

48、2.能够通过分析应答内容的无效性来调节更新时间和采集银行业务数据时长,缩短更新时间和采集更接近的历史银行业务数据来进行应答数据集的更新,从而提升应答准确性,解决了出现与客户需求应答内容缺失的问题。

本文地址:https://www.jishuxx.com/zhuanli/20241009/307929.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。