一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

确定回复语句的方法及装置与流程

2022-06-11 05:55:28 来源:中国专利 TAG:


1.本公开的实施例涉及计算机技术领域,具体地,涉及确定回复语句的方法及装置。


背景技术:

2.随着计算机技术的发展,越来越多的应用都能提供人机对话服务。机器人能够通过自然语言处理技术理解人类用户所表达的内容,并提供相应的回复。在借助人机对话来对用户进行认知行为治疗的场景中,因为用户无需面对真人,反而更加容易吐露心声。但是需要进行认知行为治疗的用户往往情绪不佳,而如果在人机对话中机器人又答非所问的话,会引起用户焦躁,烦闷的情绪,进一步加剧用户的心理问题。


技术实现要素:

3.本文中描述的实施例提供了一种确定回复语句的方法、装置以及存储有计算机程序的计算机可读存储介质。
4.根据本公开的第一方面,提供了一种确定回复语句的方法。在该方法中,获取在人机对话中用户在本轮输入的原始语句文本。然后,将原始语句文本转换成至少两个衍生语句文本。分别获取与原始语句文本和至少两个衍生语句文本相匹配的回复语句。接着,根据所获取的回复语句中的各个回复语句的重复次数来确定最终的回复语句,并将最终的回复语句呈现给用户。
5.在本公开的一些实施例中,将原始语句文本转换成至少两个衍生语句文本包括:对原始语句文本进行指代消除以获取第一语句文本;删除第一语句文本中的副词以获取第一衍生语句文本;以及对第一语句文本进行近义词替换处理以获取第二衍生语句文本。
6.在本公开的一些实施例中,对原始语句文本进行指代消除以获取第一语句文本包括:获取用户在前一轮中输入的第一历史语句文本;检索第一历史语句文本中的实体;响应于在第一历史语句文本中检索到实体,按照预先设置的代词替换规则,用第一历史语句文本中的实体来替换原始语句文本中的代词;以及响应于在第一历史语句文本中没有检索到实体,采用代词预测模型来预测原始语句文本中的代词所对应的实体。
7.在本公开的一些实施例中,分别获取与原始语句文本和至少两个衍生语句文本相匹配的回复语句包括:在问答数据库中查找分别与原始语句文本和至少两个衍生语句文本最相似的提问文本,其中,问答数据库包括多个提问文本-回复文本对;以及将所查找到的提问文本所对应的回复文本分别确定为与原始语句文本和至少两个衍生语句文本相匹配的回复语句。
8.在本公开的一些实施例中,根据所获取的回复语句中的各个回复语句的重复次数来确定最终的回复语句包括:确定所获取的回复语句中是否存在相同回复语句;响应于回复语句中存在相同回复语句,确定相同回复语句中重复次数最高的回复语句,并将重复次数最高的回复语句确定为最终的回复语句。
9.在本公开的一些实施例中,方法还包括:响应于回复语句中不存在相同回复语句,
将分别与原始语句文本和至少两个衍生语句文本相匹配的回复语句中的一个回复语句确定为最终的回复语句。
10.在本公开的一些实施例中,方法还包括:响应于回复语句中不存在相同回复语句,将表示未能提供回复的语句作为最终的回复语句。
11.在本公开的一些实施例中,方法还包括:响应于回复语句中不存在相同回复语句,获取人工客服的回复,以及在问答数据库中添加原始语句文本和至少两个衍生语句文本分别与人工客服的回复所构成的提问文本-回复文本对。
12.在本公开的一些实施例中,方法还包括:生成与原始语句文本和至少两个衍生语句文本具有相似语义的多个相似文本;以及在问答数据库中添加多个相似文本分别与人工客服的回复所构成的提问文本-回复文本对。
13.根据本公开的第二方面,提供了一种确定回复语句的装置。该装置包括至少一个处理器;以及存储有计算机程序的至少一个存储器。当计算机程序由至少一个处理器执行时,使得装置获取在人机对话中用户在本轮输入的原始语句文本;将原始语句文本转换成至少两个衍生语句文本;分别获取与原始语句文本和至少两个衍生语句文本相匹配的回复语句;根据所获取的回复语句中的各个回复语句的重复次数来确定最终的回复语句;以及将最终的回复语句呈现给用户。
14.在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置通过以下操作来将原始语句文本转换成至少两个衍生语句文本:对原始语句文本进行指代消除以获取第一语句文本;删除第一语句文本中的副词以获取第一衍生语句文本;以及对第一语句文本进行近义词替换处理以获取第二衍生语句文本。
15.在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置通过以下操作来对原始语句文本进行指代消除以获取第一语句文本:获取用户在前一轮中输入的第一历史语句文本;检索第一历史语句文本中的实体;响应于在第一历史语句文本中检索到实体,按照预先设置的代词替换规则,用第一历史语句文本中的实体来替换原始语句文本中的代词;以及响应于在第一历史语句文本中没有检索到实体,采用代词预测模型来预测原始语句文本中的代词所对应的实体。
16.在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置通过以下操作来分别获取与原始语句文本和至少两个衍生语句文本相匹配的回复语句:在问答数据库中查找分别与原始语句文本和至少两个衍生语句文本最相似的提问文本,其中,问答数据库包括多个提问文本-回复文本对;以及将所查找到的提问文本所对应的回复文本分别确定为与原始语句文本和至少两个衍生语句文本相匹配的回复语句。
17.在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置通过以下操作来根据所获取的回复语句中的各个回复语句的重复次数来确定最终的回复语句:确定所获取的回复语句中是否存在相同回复语句;响应于回复语句中存在相同回复语句,确定相同回复语句中重复次数最高的回复语句,并将重复次数最高的回复语句确定为最终的回复语句。
18.在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置还:响应于回复语句中不存在相同回复语句,将分别与原始语句文本和至少两个衍生语句文本相匹配的回复语句中的一个回复语句确定为最终的回复语句。
19.在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置还:响应于回复语句中不存在相同回复语句,将表示未能提供回复的语句作为最终的回复语句。
20.在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置还:响应于回复语句中不存在相同回复语句,获取人工客服的回复,以及在问答数据库中添加原始语句文本和至少两个衍生语句文本分别与人工客服的回复所构成的提问文本-回复文本对。
21.在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置还:生成与原始语句文本和至少两个衍生语句文本具有相似语义的多个相似文本;以及在问答数据库中添加多个相似文本分别与人工客服的回复所构成的提问文本-回复文本对。
22.根据本公开的第三方面,提供了一种存储有计算机程序的计算机可读存储介质,其中,计算机程序在由处理器执行时实现根据本公开的第一方面所述的方法的步骤。
附图说明
23.为了更清楚地说明本公开的实施例的技术方案,下面将对实施例的附图进行简要说明,应当知道,以下描述的附图仅仅涉及本公开的一些实施例,而非对本公开的限制,其中:
24.图1是根据本公开的实施例的确定回复语句的方法的示例性流程图;
25.图2是根据本公开的实施例的将原始语句文本转换成至少两个衍生语句文本的过程的示例性流程图;
26.图3是根据本公开的实施例的对原始语句文本进行指代消除以获取第一语句文本的过程的示例性流程图;以及
27.图4是根据本公开的实施例的确定回复语句的装置的示意性框图。
28.附图中的元素是示意性的,没有按比例绘制。
具体实施方式
29.为了使本公开的实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本公开的实施例的技术方案进行清楚、完整的描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域技术人员在无需创造性劳动的前提下所获得的所有其它实施例,也都属于本公开保护的范围。
30.除非另外定义,否则在此使用的所有术语(包括技术和科学术语)具有与本公开主题所属领域的技术人员所通常理解的相同含义。进一步将理解的是,诸如在通常使用的词典中定义的那些的术语应解释为具有与说明书上下文和相关技术中它们的含义一致的含义,并且将不以理想化或过于正式的形式来解释,除非在此另外明确定义。诸如“第一”和“第二”的术语仅用于将一个部件(或部件的一部分)与另一个部件(或部件的另一部分)区分开。
31.如上所述,在人机对话中,机器人回复用户问题的匹配度将直接影响用户的使用体验。本公开的实施例提出了一种确定回复语句的方法。图1示出了根据本公开的实施例的确定回复语句的方法的示例性流程图。下面参考图1来描述确定回复语句的方法100。
32.在该方法100中,在框s102处,获取在人机对话中用户在本轮输入的原始语句文本。在一个示例中,用户可通过键盘输入文字,作为原始语句文本。在另一个示例中,用户可通过麦克风输入语音。语音被转换成文字,作为原始语句文本。
33.在框s104处,将原始语句文本转换成至少两个衍生语句文本。图2示出了根据本公开的实施例的将原始语句文本转换成至少两个衍生语句文本的过程的示例性流程图。
34.在图2的框s202处,对原始语句文本进行指代消除以获取第一语句文本。在一个示例中,原始语句文本是“我不想和她分手”。在该原始语句文本中,并不清楚“她”指的是谁。因此,需要对原始语句文本进行指代消除。图3示出根据本公开的实施例的对原始语句文本进行指代消除以获取第一语句文本的过程的示例性流程图。
35.在图3的框s302处,获取用户在前一轮中输入的第一历史语句文本。在一个示例中,用户在前一轮输入的是“我女朋友要跟我分手”。在本轮输入的是“我不想和她分手”。在该示例中,第一历史语句文本是“我女朋友要跟我分手”。原始语句文本是“我不想和她分手”。
36.在框s304处,检索第一历史语句文本中的实体。在本公开的一些实施例中,可通过自然语言处理(npl)技术来检索第一历史语句文本中的实体。例如,可利用bert(bidirectional encoder representation from transformers)模型提取文本中实体。
37.在框s306处,确定在第一历史语句文本中是否检索到实体。在框s302处所述的示例中,第一历史语句文本中的实体是“我女朋友”。在另一些示例中,可能在第一历史语句文本中未提到任何实体。例如,如果第一历史语句文本是“好难过”,则在第一历史语句文本中检索不到实体。
38.如果在第一历史语句文本中检索到实体(在框s306处为“是”),则在框s308处,按照预先设置的代词替换规则,用第一历史语句文本中的实体来替换原始语句文本中的代词。在本公开的一些实施例中,预先设置的代词替换规则可例如包括:如果在第一历史语句文本中检索到一个实体,并且原始语句文本中只包括一个代词,则可将该实体直接替换该代词。在框s302处所述的示例中,第一历史语句文本中只有一个实体——“我女朋友”。在原始语句文本中只有一个代词——“她”。那么,可以用“我女朋友”来替换原始语句文本中的“她”,从而将原始语句文本修改为“我不想和我女朋友分手”。
39.预先设置的代词替换规则还可例如包括:如果在第一历史语句文本中检索到多个实体,或者原始语句文本中包括多个代词,则根据对第一历史语句文本和原始语句文本进行的语义分析来使用实体替换代词。在一个示例中,第一历史语句文本是“王先生对他老婆真好”,原始语句文本是“他是怎么做到的”。在第一历史语句文本中存在两个实体——“王先生”和“他老婆”。在原始语句文本中存在一个代词“他”。根据语义,第一历史语句文本中的主语“王先生”是动作的执行者,因此,原始语句文本中的“他”指的是“王先生”。那么,可以用“王先生”来替换原始语句文本中的“他”,从而将原始语句文本修改为“王先生是怎么做到的”。
40.如果在第一历史语句文本中没有检索到实体(在框s306处为“否”),则在框s310处,采用代词预测模型来预测原始语句文本中的代词所对应的实体。在本公开的一些实施例中,可获取用户的基本信息,例如,性别、年龄、婚姻状态、工作状态、学历等。代词预测模型可借助用户的基本信息来预测原始语句文本中的代词所对应的实体。代词预测模型可以
是经训练的机器学习模型。用于训练的语料是对代词进行了人工标注的对话文本。在一个示例中,原始语句文本是“我跟她经常在家吵架”,用户是年龄在三十到四十岁之间的已婚女性。由于是在家发生的事情,那么很可能是“我”(即,用户)的亲属。再考虑到“我”的婚姻状态和年龄,“她”可能是“婆婆”,也可能是“妈妈”。代词预测模型可分别预测“她”是婆婆的概率和“她”是妈妈的概率。
41.可计算“她”是婆婆的概率和“她”是妈妈的概率中的最大概率,再将该最大概率与阈值概率进行比较。如果最大概率大于阈值概率,则用最大概率对应的实体来替换原始语句文本中的代词。如果最大概率不大于阈值概率,则不使用任何实体来替换原始语句文本中的代词。在上述示例中,“她”是婆婆的概率为85%,“她”是妈妈的概率为15%,阈值概率为80%。那么可用“婆婆”替换原始语句文本中的代词“她”,从而将原始语句文本“我跟她经常在家吵架”修改为“我跟婆婆经常在家吵架”。如果“她”是婆婆的概率为75%,“她”是妈妈的概率为25%,阈值概率为80%,则原始语句文本仍然被保持为“我跟她经常在家吵架”。
42.回到图2,在框s204处,删除第一语句文本中的副词以获取第一衍生语句文本。在本公开的一些实施例中,可通过命名实体识别(ner)模型来获取第一衍生语句文本。在一个示例中,第一语句文本是“我老公很生气”。删除第一语句文本中的副词之后,可获取第一衍生语句文本“我老公生气”。
43.在框s206处,对第一语句文本进行近义词替换处理以获取第二衍生语句文本。在上述示例中,第一语句文本是“我老公很生气”。可将第一语句文本中的“老公”替换成更书面语的表达“丈夫”,从而获得第二衍生语句文本“我丈夫很生气”。
44.尽管上述示例仅列举了两个衍生语句文本,但是本领域的技术人员可基于上述构思生成更多的衍生语句文本。
45.回到图1,在框s106处,分别获取与原始语句文本和至少两个衍生语句文本相匹配的回复语句。在本公开的一些实施例中,可在问答数据库中查找分别与原始语句文本和至少两个衍生语句文本最相似的提问文本。即,针对原始语句文本和至少两个衍生语句文本中的每一个,在问答数据库中查找与其最相似的提问文本。其中,问答数据库包括多个提问文本-回复文本对。每个回复文本可具有一个唯一的身份标识码(id)。提问文本可与该id相关联,以与该回复文本构成提问文本-回复文本对。在问答数据库中,多个提问文本可关联同一个id。可将所查找到的提问文本所对应的回复文本分别确定为与原始语句文本和至少两个衍生语句文本相匹配的回复语句。
46.在衍生语句文本的数量为二的示例中,在问答数据库中查找与原始语句文本最相似的提问文本a,与第一衍生语句文本最相似的提问文本b,以及与第二衍生语句文本最相似的提问文本c。然后,将提问文本a对应的回复文本作为原始语句文本的回复语句。将提问文本b对应的回复文本作为第一衍生语句文本的回复语句。将提问文本c对应的回复文本作为第二衍生语句文本的回复语句。
47.在框s108处,根据所获取的回复语句中的各个回复语句的重复次数来确定最终的回复语句。在本公开的一些实施例中,可确定所获取的回复语句中是否存在相同回复语句。如果回复语句中存在相同回复语句,确定相同回复语句中重复次数最高的回复语句,并将重复次数最高的回复语句确定为最终的回复语句。在衍生语句文本的数量为二的上述示例中,如果提问文本a对应的回复文本id为1,提问文本b对应的回复文本id也为1,而提问文本
c对应的回复文本id为7,则将id为1的回复文本确定为最终的回复语句。
48.在本公开的一些实施例中,如果回复语句中不存在相同回复语句,则将分别与原始语句文本和至少两个衍生语句文本相匹配的回复语句中的一个回复语句确定为最终的回复语句。例如,可将问答数据库中与原始语句文本最相似的提问文本所对应的回复文本确定为最终的回复语句。
49.可替代地,在本公开的一些实施例中,如果回复语句中不存在相同回复语句,则将表示未能提供回复的语句作为最终的回复语句。在这种情况下,可例如将类似于“对不起,我不理解你说的”或者“意图未识别”等的表达作为最终的回复语句。
50.进一步地,在本公开的一些实施例中,如果回复语句中不存在相同回复语句,则可获取人工客服的回复。在获取人工客服的回复之后,可在问答数据库中添加原始语句文本和至少两个衍生语句文本分别与人工客服的回复所构成的提问文本-回复文本对。这样,在下一次接收到同样的用户输入的情况下,可在问答数据库中查找到匹配的回复。
51.然而,仅根据用户的输入来充实问答数据库中的提问文本-回复文本对,效率不太高。因此,在本公开的一些实施例中,可生成与原始语句文本和至少两个衍生语句文本具有相似语义的多个相似文本。然后,在问答数据库中添加多个相似文本分别与人工客服的回复所构成的提问文本-回复文本对。这样在接收到具有与原始语句文本相似语义的输入的情况下,可在问答数据库中查找到匹配的回复。从而起到“举一反三”的作用。
52.在确定了最终的回复语句之后,可在框s110处,将最终的回复语句呈现给用户。这样就完成了一轮人机对话。
53.根据本公开的实施例的确定回复语句的方法,通过从原始语句文本生成衍生语句文本,并针对原始语句文本和衍生语句文本的回复语句进行加权处理,可获取更准确的回复语句。这样有助于提供更好的人机对话体验。
54.图4示出根据本公开的实施例的确定回复语句的装置400的示意性框图。如图4所示,该装置400可包括处理器410和存储有计算机程序的存储器420。当计算机程序由处理器410执行时,使得装置400可执行如图1所示的方法100的步骤。在一个示例中,装置400可以是计算机设备或云计算节点。装置400可获取在人机对话中用户在本轮输入的原始语句文本。然后,装置400可将原始语句文本转换成至少两个衍生语句文本。装置400可分别获取与原始语句文本和至少两个衍生语句文本相匹配的回复语句。接着,装置400可根据所获取的回复语句中的各个回复语句的重复次数来确定最终的回复语句,并将最终的回复语句呈现给用户。
55.在本公开的一些实施例中,装置400可对原始语句文本进行指代消除以获取第一语句文本。装置400可删除第一语句文本中的副词以获取第一衍生语句文本。装置400可对第一语句文本进行近义词替换处理以获取第二衍生语句文本。
56.在本公开的一些实施例中,装置400可获取用户在前一轮中输入的第一历史语句文本。装置400可检索第一历史语句文本中的实体。响应于在第一历史语句文本中检索到实体,装置400可按照预先设置的代词替换规则,用第一历史语句文本中的实体来替换原始语句文本中的代词。响应于在第一历史语句文本中没有检索到实体,装置400可采用代词预测模型来预测原始语句文本中的代词所对应的实体。
57.在本公开的一些实施例中,装置400可在问答数据库中查找分别与原始语句文本
和至少两个衍生语句文本最相似的提问文本。其中,问答数据库包括多个提问文本-回复文本对。装置400可将所查找到的提问文本所对应的回复文本分别确定为与原始语句文本和至少两个衍生语句文本相匹配的回复语句。
58.在本公开的一些实施例中,装置400可确定所获取的回复语句中是否存在相同回复语句。响应于回复语句中存在相同回复语句,装置400可确定相同回复语句中重复次数最高的回复语句,并将重复次数最高的回复语句确定为最终的回复语句。
59.在本公开的一些实施例中,响应于回复语句中不存在相同回复语句,装置400可将分别与原始语句文本和至少两个衍生语句文本相匹配的回复语句中的一个回复语句确定为最终的回复语句。
60.在本公开的一些实施例中,响应于回复语句中不存在相同回复语句,装置400可将表示未能提供回复的语句作为最终的回复语句。
61.在本公开的一些实施例中,响应于回复语句中不存在相同回复语句,装置400可获取人工客服的回复,以及在问答数据库中添加原始语句文本和至少两个衍生语句文本分别与人工客服的回复所构成的提问文本-回复文本对。
62.在本公开的一些实施例中,装置400可生成与原始语句文本和至少两个衍生语句文本具有相似语义的多个相似文本。装置400可在问答数据库中添加多个相似文本分别与人工客服的回复所构成的提问文本-回复文本对。
63.在本公开的实施例中,处理器410可以是例如中央处理单元(cpu)、微处理器、数字信号处理器(dsp)、基于多核的处理器架构的处理器等。存储器420可以是使用数据存储技术实现的任何类型的存储器,包括但不限于随机存取存储器、只读存储器、基于半导体的存储器、闪存、磁盘存储器等。
64.此外,在本公开的实施例中,装置400也可包括输入设备430,例如麦克风、键盘、鼠标等,用于输入用户的原始语句文本。另外,装置400还可包括输出设备440,例如扩音器、显示器等,用于输出回复语句。
65.在本公开的其它实施例中,还提供了一种存储有计算机程序的计算机可读存储介质,其中,计算机程序在由处理器执行时能够实现如图1至图3所示的方法的步骤。
66.综上所述,根据本公开的实施例的确定回复语句的方法和装置,通过从原始语句文本生成衍生语句文本,并针对原始语句文本和衍生语句文本的回复语句进行加权处理,可获取更准确的回复语句。这样有助于提供更好的人机对话体验。
67.附图中的流程图和框图显示了根据本公开的多个实施例的装置和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
68.除非上下文中另外明确地指出,否则在本文和所附权利要求中所使用的词语的单数形式包括复数,反之亦然。因而,当提及单数时,通常包括相应术语的复数。相似地,措辞“包含”和“包括”将解释为包含在内而不是独占性地。同样地,术语“包括”和“或”应当解释为包括在内的,除非本文中明确禁止这样的解释。在本文中使用术语“示例”之处,特别是当其位于一组术语之后时,所述“示例”仅仅是示例性的和阐述性的,且不应当被认为是独占性的或广泛性的。
69.适应性的进一步的方面和范围从本文中提供的描述变得明显。应当理解,本技术的各个方面可以单独或者与一个或多个其它方面组合实施。还应当理解,本文中的描述和特定实施例旨在仅说明的目的并不旨在限制本技术的范围。
70.以上对本公开的若干实施例进行了详细描述,但显然,本领域技术人员可以在不脱离本公开的精神和范围的情况下对本公开的实施例进行各种修改和变型。本公开的保护范围由所附的权利要求限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献