一种智能对话机器人的控制系统及方法与流程
- 国知局
- 2024-06-21 11:36:06
本发明属于智能对话控制的,具体的说是一种智能对话机器人的控制系统及方法。
背景技术:
1、随着智能机器人的发展,人们对机器人系统本质的了解逐游加深,促使它开始不断地渗人到人类的生产生活中去;据此,人们发展创造了各种各样不同形态的智能系统;智能语音机器人的出现促进了学生的知识学习;通过语音识别,智能系统会根据关键词回答出正确答案,也可以根据关键词播放对应的文章、歌曲;
2、语音识别,原理是接收语音信号,并将语音信号转化为文字,或者对其进行查询的操作;按照识别对象的不同,它可以分为孤立词、连接词和连续语音识别等;根据针对的发音人,能够划分为特定人语音识别和非特定人语音识别;非特定人语音识别系统更适合生活的实际需求。语音识别包括以下几部分:提取与处理语音特征、对语音进行降、建立语言模型、声学模型训练;
3、在语音识别技术常用的方法中,随机模型法包括几种主流算法,一般主要有动态时间规整方法、矢量量化方法、隐马尔可夫模型方法、人工神经元网络方法和支持向量机等语音识别方法动态时间规整算法可以比较二者之间相似的范围明;此方法方法比较简单,识别语音较为准确,但计算起来比较复杂,并且它不容易将各种知识应用到算法中去;
4、矢量量化是对信号进行压缩,所需要训练的数据较少,所用存储空间也较小;它被用在词汇较少的情况中,并且识别率也不高。
技术实现思路
1、为了弥补现有技术的不足,解决上述的技术问题;本发明提出了一种智能对话机器人的控制系统及方法。
2、本发明解决其技术问题所采用的技术方案是:本发明提出了一种智能对话机器人的控制系统,包括硬件主架构、语音模块、微控制器、语音识别模块和人机对话系统架构;其中硬件主架构用于搭载语音模块、微控制器、语音识别模块和人机对话系统架构,并提供运行条件,完成智能对话机器人控制系统运行;语音识别模块用于对声音信号进行收集,并将声音信号传输至语音模块;语音模块内嵌入人机对话系统架构和语音识别算法,对语音识别模块传输的声音信号进行分析,同时微控制器向语音模块内的语音转化对比数据库写入系列词语,与云端数据库进行对比;人机对话系统架构为端到端模式;
3、所述语音识别模块有以下3种识别模式:
4、循环检测模式:系统会不断检测听到的语音并识别;
5、口令检测模式:识别到口令时,蜂鸣器响一声,之后开始识别,每唤醒一次识别一次;
6、按钮检测模式:外界语音传输到系统主控中心,语音识别芯片会开始计时,在固定的时间段内,外界发出对应的词汇语音;计时结束后,需要重新触发按键继续识别;
7、通过语音唤醒来制作智能系统的部分,并通过两线式串行总线识别语句、获取结果,发送和接收数据,实现人机的交互。
8、优选的,所述语音识别模块连接于所述硬件主架构,且所述硬件主架构由主板和扩展板组成,同时所述硬件主架构搭配播放模块,实现所述硬件主架构的搭建。
9、优选的,所述语音识别算法如下所示:
10、输入:模型λ=(a,b,π)和观测ο=(ο1,ο1,…,οτ);
11、输出:最优路径ι=(i1,i2,…,iτ);
12、初始化:
13、δ1(i)=πibi(o1),i=1,2,…,n;
14、
15、递推,对t=2,3,…,t:
16、
17、
18、终止:
19、p=max1≤j≤nδt(i);
20、it=argmax1≤j≤n[δt(i)];
21、最优路径回溯,对t=t-1,t-2,…,1:
22、
23、求得最优路径:
24、i=(i1,i2,…,it)。
25、优选的,所述人机对话系统架构内设有编码器和解码器,用于将对话中的上下文进行编码,并且将对话上下文的语义信息有效地用矢量表示;所述人机对话系统架构采用分层的架构方式,在编码和解码之间对上下文建立学习模型。
26、优选的,所述学习模型嵌入端到端的人机对话系统架构;通过生成方法生成或基于检索的方法抽取;序列到序列的对话生成模型将用户这轮对话的问题作为输入,借助神经元网络将用户的问题编码为一个编码矢量,并且同对话上下文的隐含矢量结合,共同作为一个神经元网络解码器的输入,逐词生成系统口复的语句。
27、一种智能对话机器人的控制方法,包括以下步骤:
28、s1:智能对话机器人开始运行识别时,语音模块先进行初始化设置,系统根据云端数据库自动添加词语列表,同时设置变量作为识别结果;随后微控制器向语音转化对比数据库写入系列词语,然后语音识别模块循环收集对话的声音信号进行对比;
29、s2:在语音识别模块循环收集声音过程中,语音识别算法结合端到端的人机对话系统架构,对声音识别后提取数据库中的系列词语作为回答;
30、s3:随后,语音模块配合语音识别模块,根据对话是否中断确定询问是否结束;最后在语音识别模块接收到智能回答数据后,将其进行解码,最终播放,完成智能对话机器人的问答工作。
31、本发明的有益效果如下:
32、1;本发明所述的一种智能对话机器人的控制系统及方法,通过viterbi算法可以帮助找到问题解决的最优路径,计算量也比同样功能的算法更小;其将全局最优的方法展开到局部最优,很好地解决了全局的问题;并且它在保证最优解的情况下,序列中的基于非线性的时间对准和针对词语边界的检测问题也得到很好地解决。
33、2;本发明所述的一种智能对话机器人的控制系统及方法,基于端到端的人机对话系统架构,再有由神经元网络模型组建的编解码器训练学习后做出决策,能减少人工成本且更具有可扩展性;将对话策略看作分类任务,根据统计的“状态-动作”数据集训练模型,然后训练好的模型将新一轮的对话状态分类到某一动作上,加快计算速率,提高智能对话机器人的响应时间。
技术特征:1.一种智能对话机器人的控制系统,其特征在于,包括硬件主架构、语音模块、微控制器、语音识别模块和人机对话系统架构;其中硬件主架构用于搭载语音模块、微控制器、语音识别模块和人机对话系统架构,并提供运行条件,完成智能对话机器人控制系统运行;语音识别模块用于对声音信号进行收集,并将声音信号传输至语音模块;语音模块内嵌入人机对话系统架构和语音识别算法,对语音识别模块传输的声音信号进行分析,同时微控制器向语音模块内的语音转化对比数据库写入系列词语,与云端数据库进行对比;人机对话系统架构为端到端模式;
2.根据权利要求1所述的一种智能对话机器人的控制系统,其特征在于:所述语音识别模块连接于所述硬件主架构,且所述硬件主架构由主板和扩展板组成,同时所述硬件主架构搭配播放模块,实现所述硬件主架构的搭建。
3.根据权利要求1所述的一种智能对话机器人的控制系统,其特征在于:所述语音识别算法如下所示:
4.根据权利要求1所述的一种智能对话机器人的控制系统,其特征在于:所述人机对话系统架构内设有编码器和解码器,用于将对话中的上下文进行编码,并且将对话上下文的语义信息有效地用矢量表示;所述人机对话系统架构采用分层的架构方式,在编码和解码之间对上下文建立学习模型。
5.根据权利要求4所述的一种智能对话机器人的控制系统,其特征在于:所述学习模型嵌入端到端的人机对话系统架构;通过生成方法生成或基于检索的方法抽取;序列到序列的对话生成模型将用户这轮对话的问题作为输入,借助神经元网络将用户的问题编码为一个编码矢量,并且同对话上下文的隐含矢量结合,共同作为一个神经元网络解码器的输入,逐词生成系统口复的语句。
6.一种智能对话机器人的控制方法,其特征在于,包括以下步骤:
技术总结本发明属于智能对话控制的技术领域,具体的说是一种智能对话机器人的控制系统及方法,所述控制系统包括硬件主架构、语音模块、微控制器、语音识别模块和人机对话系统架构,所述语音识别模块连接于硬件主架构,且所述硬件主架构由主板和扩展板组成,同时所述硬件主架构搭配播放模块,实现所述硬件主架构的搭建;通过Viterbi算法可以帮助找到问题解决的最优路径,计算量也比同样功能的算法更小;其将全局最优的方法展开到局部最优,很好地解决了全局的问题;并且它在保证最优解的情况下,序列中的基于非线性的时间对准和针对词语边界的检测问题也得到很好地解决。技术研发人员:向哲宏,李欢欢,叶林峰,高攀,王红蕾,徐小云,杨成瀚,孙觉予,许海,滕沛霖,董梅,邓大建受保护的技术使用者:四川中电启明星信息技术有限公司技术研发日:技术公布日:2024/3/12本文地址:https://www.jishuxx.com/zhuanli/20240618/22303.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。