技术新讯 > 计算推算,计数设备的制造及其应用技术 > 语义实体识别方法和装置及语音交互系统、车辆和介质与流程  >  正文

语义实体识别方法和装置及语音交互系统、车辆和介质与流程

  • 国知局
  • 2024-07-31 22:45:44

本发明涉及语音,尤其是涉及一种语义实体识别方法,以及语义识别装置以及语音交互系统和车辆及计算机可读存储介质。

背景技术:

1、实体语义理解是nlp(natural language processing,自然语言处理)中一项非常基础的任务。

2、目前,针对实体对象的语义理解处理方式是,通过深度学习ner(named entityrecognition,命名实体识别)算法抽取语音指令文本,然后通过知识库确定实体对象。这种方式需要依赖大批量的有效的标注数据,导致需要巨大的工作量,并且在业务调整过程中,需要调整训练数据集来重新从头到尾来训练模型,业务调整和扩展不灵活。

技术实现思路

1、本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明第一方面实施例提出了一种语义实体识别方法,该方法可以灵活动态调整语义增强和语义泛化效果,业务调整和扩展灵活,适用于动态场景。

2、本发明第二方面实施例提出一种语义实体识别装置。

3、本发明第三方面实施例提出一种语音交互系统。

4、本发明第四方面实施例提出一种车辆。

5、本发明第五方面实施例提出一种计算机可读存储介质。

6、为了解决上述问题,本发明第一方面实施例的语义实体识别方法,包括:对语音指令信息进行预处理,以获得所述语音指令信息包含的核心提及词;根据所述核心提及词搜索场景语义有向结构图获得与所述核心提及词相匹配的目标实体对象,其中,所述场景语义有向结构图由当前场景下的场景实体对象和所述场景实体对象的不同粒度的语义关联词汇构建而成。

7、根据本发明实施例的语义实体识别方法,通过场景动态地构建的场景语义有向结构图,可以实时的调整和扩展业务,具备强的业务扩展能力,并且场景语义有向结构图可以融合各个粒度的词汇例如近义词、同义词等语义信息,可保证语义理解的泛化效果,也可通过调整语义词表,灵活扩展泛化能力,适用于动态场景。

8、在一些实施例中,所述场景实体对象的不同粒度的语义关联词汇包括场景词汇和信息来源词汇,其中,所述场景词汇为将所述场景实体对象和所述场景实体对象的语义关联词汇进行分词获得,所述信息来源词汇包括所述场景词汇和所述场景词汇的语义关联词汇;其中,存在语义关联关系的场景词汇和信息来源词汇之间形成有向边,存在语义关联关系的场景词汇和场景实体对象之间形成有向边。

9、在一些实施例中,所述语义关联词汇包括所述场景实体对象的近义词、同义词和上位词中的至少一类。

10、在一些实施例中,根据所述核心提及词搜索场景语义有向结构图获得与所述核心提及词相匹配的目标实体对象,包括:根据所述核心提及词搜索场景语义有向结构图获得候选实体对象;获得所述核心提及词与每个所述候选实体对象之间的文本匹配度;根据所述文本匹配度确定所述语音指令信息对应的目标实体对象。

11、在一些实施例中,根据所述核心提及词搜索场景语义有向结构图获得候选实体对象,包括:根据预设图搜索算法搜索所述场景语义有向结构图,其中,与所述核心提及词相匹配的信息来源词汇作为搜素起点,以及限制搜索终点对应所述场景语音有向结构图中的场景实体对象;获得搜素终点对应的所述场景语音有向结构图中的随机场景实体对象;将满足候选实体对象条件的随机场景实体对象作为所述候选实体对象。

12、在一些实施例中,将满足候选实体对象条件的随机场景实体对象作为所述候选实体对象,包括:获得所述随机场景实体对象的得分;将所述随机场景实体对象的得分进行排序;将得分排序靠前的预设数量的随机场景实体对象作为所述候选实体对象,或者,将得分超过得分阈值的随机场景实体对象作为所述候选实体对象。

13、在一些实施例中,获得所述核心提及词与每个所述候选实体对象之间的文本匹配度,包括:获得所述核心提及词与所述候选实体对象之间的最短路径;根据所述最短路径确定具有路径联系的目标候选实体对象和目标核心提及词;获得所述目标核心提及词与所述目标候选实体对象之间的第一文本匹配长度;根据所述第一文本匹配长度和所述目标核心提及词的文本长度获得所述目标核心提及词与所述目标候选实体对象之间的文本匹配度。

14、在一些实施例中,根据所述第一文本匹配长度和所述目标核心提及词的长度获得所述目标核心提及词与所述目标候选实体对象之间的文本匹配度,包括:获得所述第一文本匹配长度与所述目标核心提及词的文本长度的比值,以作为所述目标核心提及词与所述目标候选实体对象之间的文本匹配度。

15、在一些实施例中,所述语义实体识别方法还包括:根据所述最短路径确定所述目标提及词到所述目标候选实体对象的目标场景词汇;获得所述目标场景词汇与所述目标候选实体对象之间的第二文本匹配长度;获得所述第二文本匹配长度与所述目标候选实体对象的文本长度的比值,以作为所述目标核心提及词与所述目标候选实体对象之间的文本匹配度。

16、在一些实施例中,获得所述核心提及词与每个所述候选实体对象之间的文本匹配度,包括:获得所述核心提及词与所述候选实体对象之间的最短路径;根据所述最短路径确定具有路径联系的目标候选实体对象、目标核心提及词和目标场景词汇;获得所述目标核心提及词与所述目标候选实体对象之间的第一文本匹配长度,以及获得所述目标场景词汇与所述目标候选实体对象之间的第二文本匹配长度;获得所述第一文本匹配长度与所述目标核心提及词的文本长度的第一比值,以及获得所述第二文本匹配长度与所述目标候选实体对象的文本长度的第二比值;根据所述第一比值和所述第二比值以及对应的权重获得所述目标核心提及词与所述目标候选实体对象之间的文本匹配度。

17、在一些实施例中,根据所述文本匹配度确定所述语音指令信息对应的目标实体对象,包括:确定所述文本匹配度超过匹配度阈值的候选实体对象为所述语音指令信息对应的目标实体对象。

18、在一些实施例中,对所述语音指令信息进行预处理,以获得语音指令信息包含的核心提及词,包括:将所述语音指令信息转换为语音指令文本;将所述语音指令文本进行分词处理并去除停用词,以获得所述核心提及词。

19、为了解决上述问题,本发明第二方面实施例的语义实体识别装置,包括:

20、语音信息处理模块,用于对语音指令信息进行预处理,以获得所述语音指令信息包含的核心提及词;搜索模块,用于根据所述核心提及词搜索场景语义有向结构图获得与所述核心提及词相匹配的目标实体对象,其中,所述场景语义有向结构图由当前场景下的场景实体对象和所述场景实体对象的不同粒度的语义关联词汇构建而成。

21、根据本发明实施例的语义实体识别装置,通过语音信息处理模块获得核心提及词,通过搜索模块根据核心提及词搜索场景语义有向结构图获得与核心提及词相匹配的目标实体对象,基于场景动态地构建的场景语义有向结构图,可以实时的调整和扩展业务,具备强的业务扩展能力,并且场景语义有向结构图可以融合各个粒度的词汇例如近义词、同义词等语义信息,可保证语义理解的泛化效果,也可通过调整语义词表,灵活扩展泛化能力,实现更加精准的语音交互,提高用户体验。

22、为了解决上述问题,本发明第三方面实施例的语音交互系统,包括:至少一个处理器;与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述至少一个处理器执行所述计算机程序时实现所述的实体识别方法。

23、根据本发明实施例的语音交互系统,通过至少一个处理器执行上面实施例的实体识别方法确定目标实体对象,可以实时的调整和扩展业务,提升了语义理解的泛化效果,具有灵活扩展泛化能力,可以实现更加精准的语音交互,提高用户体验。

24、为了解决上述问题,本发明第四方面实施例的车辆,包括所述的语音交互系统。

25、根据本发明实施例的车辆,通过采用上面实施例的语音交互系统,在动态场景下可以实现更加精准的语音交互,提高用户体验。

26、本发明第五方面实施例还提出一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的实体识别方法。

27、本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

本文地址:https://www.jishuxx.com/zhuanli/20240730/194463.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。