技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种语音对话场景下的地址识别系统的制作方法 > 正文

一种语音对话场景下的地址识别系统的制作方法

国知局
2024-09-05 14:45:13

本发明属于地址识别，具体涉及一种语音对话场景下的地址识别系统。

背景技术：

1、地址识别是信息抽取技术的核心组成部分，主要用于从非结构化文本数据中提取出准确的地址信息。这一技术在多个领域，如智能物流、位置服务、社交媒体分析、电子商务以及城市规划等中均有着广泛的应用前景。随着大数据时代的来临，对地址信息的需求日益增长，因此，开发高效、准确的地址识别系统显得尤为关键。

2、目前存在两种主要的地址识别方案：基于字典和规则的方案以及基于命名实体识别(ner)的方案。前者通过预定义的地址词典和规则设计实现对常见地址格式的高效识别，而后者则通过机器学习或深度学习算法从大量未标注的文本数据中学习地址实体的结构特征和上下文关系，从而实现对新出现或变异的地址格式的有效识别。

3、虽然以上两种方案在各自领域内具有一定优势，但在实际应用中仍然存在一些挑战。基于字典和规则的方案在面对地址多样性和变化性时局限性显现，需要不断更新词典和规则以应对新格式的地址识别。而基于ner的方案则需要大量标注数据进行模型训练，标注数据的质量和数量直接影响到模型的识别性能。特别是在语音转文本(asr)作为前置任务的场景下，地址识别面临更为严峻的挑战，因为asr过程中产生的错别字和语法错误会使得地址信息变得模糊和不确定，难以用传统方法进行有效处理。综上所述，现有的基于字典和规则以及基于ner的地址识别方案在单独使用时都难以完全解决复杂场景下的地址识别问题。

技术实现思路

1、本发明的目的是提供一种语音对话场景下的地址识别系统，能够通过多步骤的处理流程，实现对地址信息的精确提取和矫正。

2、本发明采取的技术方案具体如下：

3、一种语音对话场景下的地址识别系统，包括：

4、地址信息初步提取模块，用于获取用户输入的语音对话信息，从语音对话信息中识别实体地址信息，并根据字典和规则方式从语音对话信息中提取详细地址信息；

5、反向意图过滤模块，用于获取语音对话下文中的反向指示词，根据反向指示词分别对实体地址信息和详细地址信息进行过滤，得到符合用户意图的实体地址结果和详细地址结果；

6、结果合并模块，用于将实体地址结果和详细地址结果合并得到整合地址信息；

7、后处理机制模块，用于处理合并地址信息中的干扰信息，得到处理地址信息；

8、召回模块，用于利用实体地址信息和详细地址信息调用地址数据库，召回正确的地址结果，并标记为召回地址结果；

9、区域信息过滤模块，用于根据用户输入的区域信息对召回地址结果进行过滤，获取候选地址信息；

10、拼音相似度匹配模块，用于获取用户输入的语音对话信息与候选地址信息的拼音相似度，并结合语音对话下文，判断地址是否匹配，并将匹配的地址标记为矫正地址信息；

11、地址输出模块，用于将矫正地址信息与处理地址信息进行合并，得到结构化地址信息。

12、在一种优选方案中，所述地址信息初步提取模块包括语音输入获取单元、语音转文本单元、实体地址识别单元和详细地址提取单元，其中：

13、语音输入获取单元，用于接收用户输入的语音信息；

14、语音转文本单元，用于将用户的语音信息转换为文本数据；

15、实体地址识别单元，用于利用命名实体识别模型识别文本数据中的实体地址信息；

16、详细地址提取单元，用于根据字典和规则的地址识别方式从文本数据中提取详细地址信息。

17、在一种优选方案中，所述反向意图过滤模块包括上下文获取单元、反向指示词识别单元、地址信息过滤单元和用户意图地址输出单元，其中：

18、上下文获取单元，用于获取与当前用户输入的语音信息相关的对话上下文信息，对话上下文信息包括前文内容和后文内容；

19、反向指示词识别单元，用于获取对话上下文信息中反向指示词；

20、地址信息过滤单元，用于根据反向指示词，分别对实体地址信息和详细地址信息进行过滤；

21、用户意图地址输出单元，将经过反向指示词过滤后的实体地址结果和详细地址结果分别输出为实体地址结果和详细地址结果。

22、在一种优选方案中，所述结果合并模块包括准确率数据统计单元、优先级设定单元、冲突解决单元和整合输出单元，其中：

23、准确率数据统计单元，用于在离线环境中，对实体地址识别单元和详细地址提取单元的准确率进行统计，得到准确率数据；

24、优先级设定单元，用于根据准确率数据，选取准确率数据高的单元标记为主导地址单元；

25、冲突解决单元，用于在合并实体地址结果和详细地址结果中出现了相同部分地址信息时，将标记为主导地址单元的地址信息作为正确地址信息；

26、整合输出单元，用于根据正确地址信息，将实体地址结果和详细地址结果整合为整合地址信息。

27、在一种优选方案中，所述后处理机制模块包括

28、干扰单元，用于获取整合地址信息中的干扰信息，其中，干扰信息包括地址重叠和地址错误；

29、去除单元，用于去除整合地址信息中的干扰信息，并将去除后的整合地址信息标记为处理地址信息。

30、在一种优选方案中，所述召回模块包括调用地址数据库单元和地址召回单元，其中：

31、调用地址数据库单元，用于使用实体地址信息和详细地址信息调用地址数据库，其中，地址数据库包括事先建立的地址数据库和第三方地图搜索接口；

32、地址召回单元，用于根据实体地址信息和详细地址信息，搜索数据库，获取匹配的地址结果，并标记为召回地址结果。

33、在一种优选方案中，所述区域信息过滤模块包括区域信息单元和区域信息匹配单元，其中：

34、区域信息单元，用于从用户的语音对话信息中提取区域信息；

35、区域信息匹配单元，用于将区域信息与召回地址结果进行匹配，根据匹配结果，过滤掉与区域信息不符的地址结果，并将符合的地址结果标记为候选地址信息。

36、在一种优选方案中，所述拼音相似度匹配模块包括拼音转换单元、拼音相似度计算单元、阈值单元和结合单元，其中：

37、拼音转换单元，用于从语音对话信息中获取地址文本，并转换为拼音文本信息；

38、拼音相似度计算单元，用于将候选地址信息转化为地址拼音信息，获取拼音文本信息与地址拼音信息之间的相似度参数；

39、阈值单元，用于设定一个相似度阈值，判断相似度参数是否超过相似度阈值；

40、若似度参数超过相似度阈值，则判断候选地址信息清晰，并标记为候选清晰地址信息；

41、结合单元，用于根据对话上下文信息，选取符合对话上下文信息的候选清晰地址信息，并标记为矫正地址信息。

42、在一种优选方案中，所述址输出模块包括地址元素单元、合并单元和结构化单元，其中：

43、地址元素单元，用于从矫正地址信息和处理地址信息中提取矫正地址元素和处理地址元素，其中，地址元素包括国家、省、市、区/县、街道名称和门牌号码；

44、合并单元，用于将矫正地址元素和处理地址元素进行合并，并去除重复的地址元素，且按照地址的行政级别对地址元素进行排序，得到合并地址元素；

45、结构化单元，用于将合并地址元素整理成结构化地址信息。

46、以及，一种语音对话场景下的地址识别终端，包括：

47、一个或多个处理器；

48、存储装置，其上存储有一个或多个程序；

49、当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现所述语音对话场景下的地址识别系统。

50、本发明取得的技术效果为：

51、本发明，在保证了地址信息提取准确率的同时，也提高了系统的泛化性和后续维护的便捷性，通过引入外部数据和工具，以及利用拼音相似度的方法，有效地解决了asr带来的误差问题，并提高了地址结果的准确性，这些技术效果共同提升了整个地址识别系统的性能和用户体验，提高了语音对话场景下地址识别的准确性和可靠性，增加了系统的用户友好性，用户可以通过语音输入地址信息，无需手动输入，提升了用户体验，通过多模块的协同工作，系统能够充分利用各种信息源，提取和矫正地址信息，从而提高了整体的识别效果和系统性能。