基于改进的seq2seq模型的多意图识别方法、装置、设备及介质与流程
- 国知局
- 2024-06-21 11:38:25
本技术涉及自然语言处理领域,涉及但不限于一种基于改进的seq2seq模型的多意图识别方法、车辆中控设备及存储介质。
背景技术:
1、在智能人机对话系统,如车载对话系统中,用户通常会在同一语音中表达多个意图,即一句话中希望车载设备完成控制指令,车载设备需要执行一系列指令。示例性地,在智能车机中,驾驶员或乘客在一句话中表述出“请打开车窗并将空调温度调低”的多意图语音,这种多意图的语音输入对系统的识别能力提出了更高的要求。如果系统不能正确地理解和区分这些不同的意图,将导致不正确的响应,严重损害用户体验。为此,目前亟需提供一种基于改进的seq2seq模型的多意图识别方法。
技术实现思路
1、本技术的目的之一在于提供一种基于改进的seq2seq模型的多意图识别方法;目的之二在于提供一种基于改进的seq2seq模型的多意图识别装置;目的之三在于提供一种车辆中控设备,目的之四在于提供一种存储介质。
2、为了实现上述目的,本技术采用的技术方案如下:
3、第一方面,本技术提供一种基于改进的seq2seq模型的多意图识别方法,所述方法包括:
4、获得待识别语音信息,并根据所述待识别语音信息中的各个词,构建对应所述词的特征向量;其中,所述特征向量包括字符向量和分词向量;
5、将所述特征向量输入至多意图识别模型中,采用所述多意图识别模型对所述特征向量进行处理,得到处理结果;其中,所述处理结果包括所述待识别语音信息对应的由多个单意图语句组成的意图识别结果,所述多意图识别模型是基于seq2seq模型进行改进的;
6、所述处理结果至少依据所述字符向量对应的局部上下文特征向量和所述分词向量对应的全局上下文特征向量得到的。
7、根据上述技术手段,通过待识别语音信息,并构建待识别语音信息中各个词的包含有字符向量和分词向量的特征向量;进一步地,由多意图识别模型进行多个单意图语句的识别,为一种自动识别方案。此外,由多意图识别模型两种特征向量:字符向量对应的局部上下文特征向量和分词向量对应的全局上下文特征向量,相当于不仅考虑到局部上下文特征向量对意图识别结果的影响,还考虑道路全局上下文特征向量对意图识别结果的影响;也即考虑到了字符向量在序列信息中的局部上下文特征向量,还考虑到了分词向量在各个层次或长距离上下文语义中的全局上下文特征向量,结合这两个上下文特征向量所体现的待识别语音信息的多个意图特征,对待识别语音信息对应的多个单意图语句进行识别,可进一步保证识别准确性。再有,本技术实施例中的多意图识别模型具有一定的稳定性和健壮性,不易受外界环境的干扰,由多意图识别模型进行识别,可保证意图识别结果的稳定性和准确性。
8、进一步,所述根据所述待识别语音信息中的各个词,构建对应所述词的特征向量,包括:利用python工具包jieba中的分词模型对所述待识别语音信息进行分词,得到所述待识别语音信息的分词结果;其中,所述分词结果包括字符序列和分词序列;以所述分词结果中的序列作为输入,采用预设词向量模型对所述分词结果进行向量化处理,得到所述字符序列中各个字符对应的字符向量和所述分词序列中各个分词对应的分词向量。
9、根据上述技术手段,字符向量和分词向量为后续的多意图识别模型提供了文本数据的数字化表示,使其能够更好地捕捉不同意图之间的语义和上下文信息。
10、进一步,多意图识别模型包括编码模块和解码模块,所述编码模块包括双通道特征提取网络,所述采用所述多意图识别模型对所述特征向量进行处理,得到处理结果,包括:将所述字符向量输入至第一通道特征提取网络,结合所述待识别语音信息上下文,进行双向编码处理,得到所述字符向量对应的用于表征每个字符的序列信息的所述局部上下文特征向量;将所述分词向量输入至第二通道特征提取网络,结合所述待识别语音信息上下文,进行膨胀卷积处理,得到所述分词向量对应的用于表征每个分词与各个分词之间的上下文语义关系的所述全局上下文特征向量,其中,所述第一通道特征提取网络与所述第二通道特征提取网络不同;对所述局部上下文特征向量和所述全局上下文特征向量进行特征融合,得到融合上下文特征向量;采用所述解码模块对所述融合上下文特征向量进行特征解码,得到所述处理结果。
11、根据上述技术特征,引入双向长短期记忆(bilstm)模型来提取待识别语音信息中单个字符的顺序和方向信息,从而有助于捕捉待识别语音信息中字符级别的序列信息。同时为了获取更大的卷积视野,选用迭代膨胀卷积神经网络(idcnn)和注意力机制,从而有利于捕捉更高层次的词级别语义关系。如此,经过使用bilstm和idcnn-attention进行序列信息和捕捉更高层次的词级别语义关系的双通道联合特征提取,使得向量能够更好地表征文本的特征,能够更全面、准确地捕捉输入序列的信息,有利于后续的多个单意图语句识别效果的提升。同时,增强模型的上下文理解和多意图处理能力,使其更适用于复杂多样的对话情境,从而提高模型的实用性。
12、进一步,所述第二通道特征提取网络包括迭代膨胀卷积神经网络和第一注意力机制网络,所述将所述分词向量输入至第二通道特征提取网络,结合所述待识别语音信息上下文,进行膨胀卷积处理,得到所述分词向量对应的用于表征每个分词与各个分词之间的上下文语义关系的所述全局上下文特征向量,包括:将所述分词向量输入至所述迭代膨胀卷积神经网络,采用多个膨胀卷积块分别对所述分词向量进行膨胀处理,得到中间特征向量;将所述中间特征向量输入至所述第一注意力机制网络,得到所述分词向量对应的所述全局上下文特征向量。
13、根据上述技术特征,本技术实施例中,由于待识别语音信息大多数为长文本,通过注意力机制能够为模型提取的每一个特征赋予权重,减小无效特征对模型进行实体识别的影响,相较于不加入注意力机制的idcnn效果要更好。
14、进一步,所述对所述局部上下文特征向量和所述全局上下文特征向量进行特征融合,得到融合上下文特征向量,包括:获得所述编码模块为所述局部上下文特征向量分配的第一权重,以及为所述全局上下文特征向量分配的第二权重;基于所述第一权重和所述第二权重,对所述局部上下文特征向量和所述全局上下文特征向量进行加权处理,得到所述融合上下文特征向量。
15、根据上述技术手段,本技术实施例可以将局部上下文特征向量和全局上下文特征向量加权,后续所使用的融合上下文特征向量将同时包含长距离依赖信息和局部信息,语义信息更加丰富,有助于提高实体识别的准确率。
16、进一步,所述多意图识别模型的训练过程包括:获得包括多个已标注单意图语句的样本语音信息,并根据所述样本语音信息中的各个词,构建对应所述词的样本特征向量;其中,所述样本特征向量包括样本字符向量和样本分词向量;将所述样本特征向量输入至待训练多意图识别模型中,采用所述待训练多意图识别模型对所述样本特征向量进行处理,得到所述样本语音信息对应的多个预测单意图语句;利用所述交叉熵损失函数,确定所述多个已标注单意图语句中每一已标注单意图语句与对应的预测单意图语句之间的损失值,从而得到所述多个已标注单意图语句分别对应的多个损失值;基于所述多个损失值,对所述待训练多意图识别模型的网络参数进行调整,以使调整后的所述待训练多意图识别模型输出的损失值满足预设收敛条件。
17、进一步,所述方法还包括:根据所述意图识别结果,依次执行每一单意图语句,执行相应的车辆控制操作。
18、第二方面,本技术提供一种基于改进的seq2seq模型的多意图识别装置,所述装置包括:
19、获得模块,用于获得待识别语音信息;
20、处理模块,用于根据所述待识别语音信息中的各个词,构建对应所述词的特征向量;其中,所述特征向量包括字符向量和分词向量;
21、输入模块,用于将所述特征向量输入至多意图识别模型中;
22、多意图识别模型,用于采用所述多意图识别模型对所述特征向量进行处理,得到处理结果;其中,所述处理结果包括所述待识别语音信息对应的由多个单意图语句组成的意图识别结果,所述多意图识别模型是基于seq2seq模型进行改进的;
23、所述处理结果至少依据所述字符向量对应的局部上下文特征向量和所述分词向量对应的全局上下文特征向量得到的。
24、第三方面,本技术提供一种车辆中控设备,所述设备包括:存储器和处理器,
25、所述存储器存储有可在处理器上运行的计算机程序;
26、所述处理器执行所述计算机程序时实现如第一方面或第一方面的实施例中任一项所述的基于改进的seq2seq模型的多意图识别方法。
27、第四方面,本技术提供一种存储介质,所述存储介质存储有一个或者多个计算机程序,一个或者多个计算机程序可被一个或者多个处理器执行,以实现如第一方面或第一方面的实施例中任一项所述的基于改进的seq2seq模型的多意图识别方法。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22598.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。