技术新讯 > 计算推算,计数设备的制造及其应用技术 > 用于短文本的语义解析的制作方法  >  正文

用于短文本的语义解析的制作方法

  • 国知局
  • 2024-08-22 14:44:14

本公开的实施例总体涉及计算机技术,并且更具体地涉及语言处理。

背景技术:

1、随着互联网的快速发展,诸如博客、论坛以及聊天软件的各种平台上出现了大量的短文本。短文本的示例可以在诸如聊天消息、搜索查询、产品描述或在线评论的许多上下文中找到。这些短文本承载着丰富的信息,例如数据信息。短文本是稀疏的,特征数量少,并且无法提供足够的词共现,这对使用现有的自然语言处理(nlp)方法来解析短文本提出了巨大的挑战。

技术实现思路

1、本发明的实施例提供了一种用于解析短文本的方案。

2、在第一方面,提出了一种方法。方法包括:获得与短文本相关联的句子集合,句子集合中的每个句子包含短文本中的所有单词;确定与句子集合相关联的句法特征集合,句法特征集合中的每个句法特征指示对应句子的成分关系和依存关系中的至少一项;以及基于句法特征集合来确定短文本的语义结构。根据本公开的第一方面的方法能够利用现有的nlp技术来确定短文本的语义结构。从而,与传统解决方案相比,根据本公开的第一方面的方法使得能够以更低的成本以改善的准确度解析短文本。

3、在第二方面,提出了一种系统。系统包括:至少一个处理器;至少一个存储器,至少一个存储器通信地被耦合到至少一个处理器并且包括计算机可读指令,计算机可读指令在由至少一个处理器执行时使至少一个处理器执行根据本公开的第一方面的方法。

4、在第三方面,提出了一种非瞬态计算机可读存储介质。非瞬态计算机可读存储介质存储计算机可读指令,计算机可读指令在由计算设备执行时使计算设备执行根据本公开的第一方面的方法。

5、提供本技术实现要素:是为了以简化的形式介绍概念的选择,这些概念将在下面的具体实施方式中被进一步描述。本发明内容并不旨在标识所要求保护的主题的关键特征或基本特征,也不旨在被用来限制所要求保护的主题的范围。

技术特征:

1.一种方法,包括:

2.根据权利要求1所述的方法,其中确定所述短文本的所述语义结构包括:

3.根据权利要求2所述的方法,其中所述句子集合包括目标句子,所述句法特征集合包括与所述目标句子相关联的目标句法特征,所述目标句法特征包括指示所述目标句子的所述成分关系的目标成分树,所述至少一个候选语义结构包括与所述目标句子相关联的目标候选语义结构,并且确定所述至少一个候选语义结构包括:

4.根据权利要求3所述的方法,其中重构所述子树包括:

5.根据权利要求3所述的方法,其中重构所述子树包括:

6.根据权利要求5所述的方法,其中所述目标句法特征还包括指示所述目标句子的所述依存关系的目标依存树,并且确定所述根节点包括:

7.根据权利要求1所述的方法,其中所述短文本对应于搜索查询,并且获得所述句子集合包括:

8.根据权利要求1所述的方法,其中所述句子集合包括目标句子,确定所述句法特征集合包括:

9.一种系统,包括:

10.根据权利要求9所述的系统,其中确定所述短文本的所述语义结构包括:

11.根据权利要求10所述的系统,其中所述句子集合包括目标句子,所述句法特征集合包括与所述目标句子相关联的目标句法特征,所述目标句法特征包括指示所述目标句子的所述成分关系的目标成分树,所述至少一个候选语义结构包括与所述目标句子相关联的目标候选语义结构,并且确定所述至少一个候选语义结构包括:

12.根据权利要求11所述的系统,其中重构所述子树包括:

13.根据权利要求11所述的系统,其中重构所述子树包括:

14.根据权利要求13所述的系统,其中所述目标句法特征还包括指示所述目标句子的所述依存关系的目标依存树,并且确定所述根节点包括:

15.根据权利要求9所述的系统,其中所述短文本对应于搜索查询,并且获得所述句子集合包括:

16.根据权利要求9所述的系统,其中所述句子集合包括目标句子,确定所述句法特征集合包括:

17.一种非瞬态计算机可读存储介质,所述非瞬态计算机可读存储介质存储计算机可读指令,所述计算机可读指令在由计算设备执行时使所述计算设备执行包括以下的动作:

18.根据权利要求17所述的非瞬态计算机可读存储介质,其中确定所述短文本的所述语义结构包括:

19.根据权利要求18所述的非瞬态计算机可读存储介质,其中所述句子集合包括目标句子,所述句法特征集合包括与所述目标句子相关联的目标句法特征,所述目标句法特征包括指示所述目标句子的所述成分关系的目标成分树,所述至少一个候选语义结构包括与所述目标句子相关联的目标候选语义结构,并且确定所述至少一个候选语义结构包括:

20.根据权利要求17所述的非瞬态计算机可读存储介质,其中所述短文本对应于搜索查询,并且获得所述句子集合包括:

技术总结本公开的实施例涉及针对短文本的语义解析。根据本公开的实施例,提出了一种方法。方法包括:获得与短文本相关联的句子集合,句子集合中的每个句子包含短文本中的所有单词;确定与句子集合相关联的句法特征集合,句法特征集合中的每个句法特征指示对应句子的成分关系和依存关系中的至少一项;以及基于句法特征集合来确定短文本的语义结构。技术研发人员:熊泓宇,汪罕,厉锐,冯一琦,高远,曾翔宇,鹿青怡,刘宾受保护的技术使用者:脸萌有限公司技术研发日:技术公布日:2024/8/20

本文地址:https://www.jishuxx.com/zhuanli/20240822/279657.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。