一种智能问答系统构建方法及相关设备与流程

2022-03-23 08:21:22 来源：中国专利 TAG：

1.本技术涉及智能问答领域，具体涉及一种智能问答系统构建方法及相关设备。

背景技术：

2.随着计算机相关技术的发展，智能问答系统被广泛应用于医疗、商品推荐、产品介绍、政企服务等场景中，在节约人力资源，提高信息处理的效率，降低网站运行成本方面起着积极作用。智能问答系统通常是将积累的无序语料信息，进行有序和科学的整理，并建立基于知识的分类模型，这些分类模型可以为新增加的语料提供咨询和服务。目前，智能问答系统的构建在一定程度上依赖于用户画像，而用户画像的构建多数是基于用户年龄、性别、消费记录等个人信息完成的，另外，也存在一些对话机器人、智能推荐系统的相关方案，但是这些方案多基于用户消费记录捕捉用户消费习惯或兴趣演化过程，同时辅助以用户年龄、性别、地域等个人信息，在构建智能问答系统方面，忽略了某些关键信息，导致智能问答系统的对话效果欠佳。

技术实现要素：

3.本技术实施例提供了一种智能问答系统构建方法及相关设备。
4.第一方面，本技术实施例提供一种智能问答系统构建方法，该方法包括：
5.获取第一用户与业务专家的第一对话数据和业务专家对第一用户的第一个性打分数据；
6.根据第一对话数据和第一个性打分数据得到第一语料数据；
7.根据第一用户的第一历史对话数据，得到第一用户的第一词频特征向量和第一个性特征向量，第一历史对话数据包括第一对话数据；
8.获取第一用户的基本信息，根据第一用户的基本信息、第一词频特征向量和第一个性特征向量，生成第一用户的第一画像；
9.获取第一用户与第二用户对话的第二语料数据，第二语料数据包括第一用户与第二用户的第二对话数据、第一用户对第二用户的第二个性打分数据和第二用户对第一用户的第三个性打分数据；
10.根据第一语料数据、第二对话数据、第二个性打分数据和第三个性打分数据，得到第三语料数据；
11.采用第一画像和第三语料数据构建智能问答系统。
12.在一些可能的实施方式中，根据第一用户的第一历史对话数据，得到第一用户的第一词频特征向量和第一个性特征向量，包括：
13.获取第一历史对话数据中每个词语出现的频率，将所述每个词语出现的频率确定为第一词频特征向量；
14.基于预设的个性标签列表，对第一历史对话数据进行个性编码，得到第一个性特征向量。
15.在一些可能的实施方式中，该方法还包括：获取第三用户向智能问答系统输入的用户问句，以及获取用户问句的向量表示；在用户画像库中存在第三用户的第三画像的情况下，基于用户问句的向量表示和第三画像，从知识问答库中查询得到与用户问句的相似度大于或等于预设值的至少一个参考用户问句；基于用户问句和至少一个参考用户问句，从至少一个参考用户问句中确定出目标用户问句；向第三用户返回目标用户问句对应的回答。
16.在一些可能的实施方式中，基于用户问句和至少一个参考用户问句，从至少一个参考用户问句中确定出目标用户问句，包括：将至少一个参考用户问句分别与用户问句拼接，得到至少一个问句对；采用自然语言处理技术对至少一个问句对进行二分类，得到至少一个问句对中每个问句对的相似度得分；确定至少一个问句对中相似度得分最高的问句对，将相似度得分最高的问句对中的参考用户问句确定为目标用户问句。
17.在一些可能的实施方式中，在知识问答库中不存在与用户问句的相似度大于或等于预设值的参考用户问句的情况下，该方法还包括：向业务专家推送用户问句；获取业务专家对用户问句的回答；向第三用户返回业务专家对所述用户问句的回答，以及将用户问句和业务专家对用户问句的回答添加至知识问答库。
18.在一些可能的实施方式中，在获取第一用户与第二用户对话的第二语料数据之前，该方法还包括：获取预先构建的用户推荐系统基于第一画像，为第一用户推荐的第二用户；
19.在一些可能的实施方式中，第二语料数据还包括第一用户对用户推荐系统的推荐效果的打分值，该方法还包括：对第一画像进行编码，得到第一编码向量；对第二画像进行编码，得到第二编码向量；对第一用户与第二用户对话时发起的话题进行编码，得到第三编码向量；采用第一编码向量、第二编码向量、第三编码向量及第一用户对所述用户推荐系统的推荐效果的打分值，训练用户推荐系统。
20.第二方面，本技术实施例提供一种对话装置，所述装置包括：获取模块、存储模块、特征提取模块、用户画像模块和搭建模块。
21.获取模块，用于获取第一用户和业务专家的第一对话数据和业务专家对第一用户的第一个性打分数据；
22.存储模块，用于根据第一对话数据和第一个性打分数据得到第一语料数据；
23.特征提取模块，用于根据第一用户的第一历史对话数据，得到第一用户的第一词频特征向量和第一个性特征向量，第一历史对话数据包括所述第一对话数据；
24.用户画像模块，用于获取第一用户的基本信息，根据第一用户的基本信息、第一词频特征向量和第一个性特征向量，生成第一用户的第一画像；
25.获取模块，还用于获取第一用户与第二用户对话的第二语料数据，第二语料数据包括第一用户与第二用户的第二对话数据、第一用户对第二用户的第二个性打分数据和第二用户对第一用户的第三个性打分数据；
26.储存模块，还用于根据第一语料数据、第二对话数据、第二个性打分数据和第三个性打分数据，得到第三语料数据；
27.搭建模块，采用第一画像和第三语料数据构建智能问答系统。
28.第三方面，本技术实施例提供一种电子设备，包括：处理器，所述处理器与存储器
相连，所述存储器用于存储计算机程序，所述处理器用于执行所述存储器中存储的计算机程序，以使得所述电子设备执行如第一方面所述的方法。
29.第四方面，本技术实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序使得计算机执行如第一方面所述的方法。
30.第五方面，本技术实施例提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机可操作来使计算机执行如第一方面所述的方法。
31.可以看出，在本技术实施例中，通过获取第一用户与业务专家的第一对话数据和业务专家对第一用户的第一个性打分数据；根据第一对话数据和第一个性打分数据得到第一语料数据；根据第一用户的第一历史对话数据，得到第一用户的第一词频特征向量和第一个性特征向量，第一历史对话数据包括第一对话数据；获取第一用户的基本信息，根据第一用户的基本信息、第一词频特征向量和第一个性特征向量，生成第一用户的第一画像；获取第一用户与第二用户对话的第二语料数据，第二语料数据包括第一用户与第二用户的第二对话数据、第一用户对第二用户的第二个性打分数据和第二用户对第一用户的第三个性打分数据；根据第一语料数据、第二对话数据、第二个性打分数据和第三个性打分数据，得到第三语料数据；采用第一画像和第三语料数据构建智能问答系统。这样采用融入了个性特征(即第一个性特征向量)的画像构建方式构建第一画像，再采用第一画像构建智能问答系统，有利于使智能问答系统更具针对性的进行对话，另外，第三语料数据是采用第二对话数据、第二个性打分数据和第三个性打分数据对第一语料数据进行扩充得到的，不仅能够使语料数据更全面，且在语料数据中融入了个性特征(即第二个性打分数据和第三个性打分数据)，采用更全面的语料数据和具有个性特征的用户画像训练智能问答系统，有利于提升智能问答系统对话的准确性和对话效果。
附图说明
32.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
33.图1为本技术实施例提供的一种智能问答系统构建方法的流程示意图；
34.图2为本技术实施例提供的一种个性编码器的结构示意图；
35.图3为本技术实施例提供的一种用户推荐系统的结构示意图；
36.图4为本技术实施例提供的一种自然语言处理表示模型的示意图；
37.图5为本技术实施例提供的另一种智能问答系统构建方法的流程示意图；
38.图6为本技术实施例提供的一种智能问答系统构建装置结构示意图；
39.图7为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
40.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本申
请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
41.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
42.在本文中提及“实施例”意味着，结合实施例描述的特定特征、结果或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。
43.参阅图1，图1为本技术实施例提供的一种智能问答系统构建方法，该方法应用于电子设备，如图1所示，该方法包括步骤101-107：
44.101：获取第一用户与业务专家的第一对话数据和所述业务专家对所述第一用户的第一个性打分数据。
45.示例性的，通过搭建人—人对话平台，实现第一用户与业务专家对话，获取第一用户与业务专家的第一对话数据，可选的，业务专家针对第一用户提出的对话话题进行询问或对话交流，业务专家为拥有相应知识背景的人，对话话题为某问题、某商品或某类商品。
46.示例性的，当第一用户和业务专家对话结束后，获取业务专家对第一用户的第一个性打分数据，具体包括：业务专家从预设的个性标签列表中选取目标个性标签，然后对第一用户在目标个性标签上的表现进行打分。其中，个性标签列表由业务专家制定，其元素个数和顺序保持固定，例如：元素个数n＝100，个性标签列表可包括：“积极”、“消极”、“激进”、“保守”、“热情”、“冷漠”、“追求质量”、“追求性价比”等；然后将每一个性标签打分范围设置为[0，1]，该打分范围表征了第一用户在个性标签上从完全不符合到完全符合的状态，进一步的，可将个性标签划分为v个等级，例如，当v＝3，打分选项为[0，0.5，1.0]。
[0047]
102：根据所述第一对话数据和所述第一个性打分数据得到第一语料数据。
[0048]
示例性的，将包括第一用户与业务专家的第一对话数据和业务专家对第一用户的第一个性打分数据的第一语料数据存储在语料数据库中，且不断的进行扩充更新，以便进行个性编码器的训练。其中，第一语料数据是指当前语料数据库中的语料数据，包括第一对话数据和第一个性打分数据，其可能还包括其他用户与业务专家的对话数据和业务专家对该用户的个性打分数据。
[0049]
103：根据所述第一用户的第一历史对话数据，得到所述第一用户的第一词频特征向量和第一个性特征向量，所述第一历史对话数据包括所述第一对话数据。
[0050]
示例性的，第一历史对话数据包括上述第一对话数据，具体可以是第一用户最近一段时间内(或最近几次对话中)的对话数据，可选的，根据第一用户的第一历史对话数据，得到第一用户的第一词频特征向量，具体包括：通过分词工具，获取第一历史对话数据中每个词语出现的频率，将每个词语的出现的频率作为第一词频特征向量。
[0051]
示例性的，基于第一用户的第一历史对话数据，得到第一用户的第一个性特征向量，具体包括：基于预设的个性标签列表，对第一历史对话数据进行个性编码，得到第一个
性特征向量。可选的，采用预先构建的个性编码器对第一历史对话数据进行编码，得到第一个性特征向量，个性编码器可采用lstm(long short-term memory，长短期记忆)模型，个性编码器结构示意图请参见图2，输入第一用户第一历史对话数据，输出得到第一个性特征向量，具体包括：从语料数据库中获取第一用户的第一历史对话数据，将第一历史对话数据作为模型输入x(即x1…
x
t
…
xn)，且第一历史对话数据的长度n不固定，模型输出结果y为长度为n的第一个性特征向量，通过每一状态的输出h(即h0、h1…ht-1
、h
t
…hn-1
)和每一状态的出入x与c(即c0、c1…ct-1
、c
t
…cn-1
)相乘，确定舍弃或保留的信息。
[0052]
可选的，上述长度为n的第一个性特征向量可编码为如下形式：根据预设的长度为n的个性标签列表，按照个性标签列表中的标签顺序，将对应分值排列为n维向量，作为第一用户的第一个性特征向量。例如，长度为n＝100的个性标签列表[“积极”，“消极”，“冷漠”，
···
]，则第一用户的第一个性特征向量可表示为长度为n的向量[a，b，c，
···
]，其中第i个元素为针对第i个标签的打分情况，例如：积极＝a，消极＝b，冷漠＝c，
···
，其中，对上述未打分的个性标签，默认填充为所有用户在该个性标签上打分的平均值。
[0053]
104：获取所述第一用户的基本信息，根据所述第一用户的基本信息、所述第一词频特征向量和所述第一个性特征向量，生成所述第一用户的第一画像。
[0054]
示例性的，在本技术具体实施例中，第一用户的基本信息可包括：第一用户的性别、年龄、地域、消费记录；然后基于第一用户的第一基本信息、上述第一词频特征向量和第一个性特征向量，得到第一用户的第一画像，并将第一画像存储在用户画像库，以便用户推荐系统和智能问答系统模型的训练。该实施方式中，在第一画像中融入第一用户的个性特征(第一个性特征向量)，能够使第一画像更精确地描述第一用户。
[0055]
可选的，在本技术实施例中，还需获取第二用户与业务专家的第三对话数据，根据第二历史对话数据得到第二用户的第二词频特征向量和第二个性特征向量，其中，第二历史对话数据包括第三对话数据，具体可以是第二用户最近一段时间内(或最近几次对话中)的对话数据；获取第二用户的第二基本信息，基于第二用户的基本信息、第二词频特征向量和第二个性特征向量，生成第二用户的第二画像，并将第二画像添加至用户画像库，以便用户推荐系统和智能问答系统等模型的训练。其中，第二用户的基本信息同样可包括：第二用户的性别、年龄、地域、消费记录。
[0056]
105：获取所述第一用户与第二用户对话的第二语料数据，所述第二语料数据库包括所述第一用户与所述第二用户的第二对话数据、所述第一用户对所述第二用户的第二个性打分数据和所述第二用户对所述第一用户的第三个性打分数据。
[0057]
示例性的，上述第二语料数据包括第一用户和第二用户的第二对话数据、第一用户对第二用户的第二个性打分数据和第二用户对第一用户的第三个性打分数据，将第二语料数据也存储至语料数据库中，进一步扩大语料数据库中的数据，以便上述个性编码器、用户推荐系统或智能问答系统的训练优化，其中，获取第二语料数据的方法可参考步骤101中的描述，区别在于是第一用户与第二用户展开对话，且需要互相进行个性打分。
[0058]
示例性的，在获取第一用户和第二用户对话的第二语料数据之前，还需获取预先构建的用户推荐系统基于上述第一画像为第一用户推荐的第二用户，例如：用户推荐系统可从用户画像库中匹配出与第一画像相似度最高的用户画像，将该用户画像所属的第二用户推荐给第一用户；上述第二语料数据还包括第一用户对用户推荐系统的推荐效果打分
值，其中，第一用户对用户推荐系统的推荐效果的打分值，即第一用户与第二用户对话交流后的目标达成情况，具体分值范围可选[0，1]，可选的，参考步骤101个性标签打分方法，将该打分值作为推荐效果的反馈和评价。可选的，将第一用户与第二用户对话时发起的话题和第一用户对用户推荐系统的推荐效果的打分值存储至上述用户画像库，以便用户推荐系统的训练。
[0059]
示例性的，可采用如下步骤训练用户推荐系统：对第一画像进行编码得到第一编码向量，对第二画像进行编码得到第二编码向量，对第一用户与第二用户对话时发起的话题进行编码得到第三编码向量，然后采用第一编码向量、第二编码向量、第三编码向量和第一用户对用户推荐系统的推荐效果的打分值训练用户推荐系统。
[0060]
示例性的，用户推荐系统结构示意图请参见图3，包括“第一画像模块”、“第二画像模块”、“话题模块”以及“协同滤波模块”。其中“第一画像模块”用于对第一用户的第一画像进行编码得到第一编码向量，“第二画像模块”用于对第二用户的第二画像进行编码得到第二编码向量，第一画像模块和第二画像模块除输入特征和输出特征之外，其结构和权重参数一致。“话题模块”用于对第一用户与第二用户对话时发起的话题进行编码得到第三编码向量，可选的，话题模块具体可采用编码层进行编码，其结构可参见上述lstm模型，此处不再赘述。“协同滤波模块”包括拼接层和两个全连接层，其中，拼接层用于对输入的第一编码向量、第二编码向量和第三编码向量进行拼接，得到拼接向量，两个全连接层用于对拼接向量进行分类，得到用户推荐系统的推荐效果的预测得分，将第一用户对用户推荐系统的推荐效果的打分值作为真实值，对用户推荐系统进行监督训练。可选的，训练所用的损失函数可以是交叉熵函数，训练方式可采用随机梯度下降法，且主要为在线训练。
[0061]
换言之即是，训练用户推荐系统时的输入为第一用户的第一画像、第二用户的第二画像和第一用户发起的话题，应理解，第一画像包括第一词频特征向量、第一个性特征向量和第一用户的基本信息，第一编码层层用于对第一词频特征向量、第一个性特征向量和第一用户的基本信息进行编码，分别得到编码向量a1、编码向量a2和编码向量a3，第一拼接层用于对输入的编码向量a1、编码向量a2和编码向量a3进行拼接,得到第一编码向量。第二画像包括第二词频特征向量、第二个性特征向量和第二用户的基本信息，第二编码层用于对第二词频特征向量、第二个性特征向量和第二用户的基本信息进行编码，分别得到编码向量b1、编码向量b2和编码向量b3，第二拼接层用于对输入的编码向量b1、编码向量b2和编码向量b3进行拼接，得到第二编码向量。
[0062]
106：根据所述第一语料数据、所述第二对话数据、所述第二个性打分数据和所述第三个性打分数据，得到第三语料数据。
[0063]
示例性的，将第二对话数据、第二个性打分数据和第三个性打分数据添加至语料数据库，以对第一语料数据进行扩充，扩充后语料数据库中的语料数据即第三语料数据，其中第三语料数据可能还包括其他用户与业务专家的对话数据和业务专家对该用户的个性打分数据，第三语料数据可用于后续构建并训练智能问答系统。
[0064]
107：采用所述第一画像和所述第三语料数据构建智能问答系统。
[0065]
本技术具体实施例中，搭建一个智能问答系统，并将第三语料数据和第一画像作为训练数据训练该智能问答系统。
[0066]
示例性的，在采用所述第一画像和所述第三语料数据构建智能问答系统之后，即
可利用该智能问答系统与用户展开对话。具体问答场景中，获取第三用户向智能问答系统输入的用户问句，并获取该用户问句的向量表示，在上述用户画像库中存在第三用户的第三画像的情况下，基于上述用户问句的向量表示和第三画像，从预设的知识问答库中检索得到与上述用户问句的相似度大于或等于预设值的至少一个参考用户问句，然后基于用户问句和至少一个参考用户问句，从上述至少一个参考用户问句中确定出目标用户问句，然后向第三用户返回目标用户问句对应的回答。应理解，知识问答库中的用户问句与对应的回答通常是关联存储的，比如：用户问句可以是针对某商品的问题，目标用户问句对应的回答可以是针对该问题的解决方案，等等。可选的，智能问答系统还支持语音输入，也就是说第三用户输入的用户问句可以是语音，具体可采用语音识别模型将该语音转换为相应的文本。
[0067]
示例性的，基于用户问句和至少一个参考用户问句，从上述至少一个参考用户问句中确定出目标用户问句，具体包括：将至少一个参考用户问句分别与用户问句拼接，得到至少一个问句对；然后采用自然语言处理技术对至少一个问句对进行二分类，得到至少一个问句对中每个问句对的相似得分；然后确定至少一个问句对中相似得分最高的问句对，将相似得分最高的问句对中的参考用户问句确定为目标用户问句。
[0068]
示例性的，对于第三用户输入的用户问句，采用自然语言处理(nlp，natural language processing)表示模型进行编码，得到对应的向量表示，其中，如图4示，nlp表示模型可以是经过中文语料预训练的bert(bidirectional encoder representation from transformers，基于转换器的双向编码表征器)模型，首先将用户问句转化成token(标记)序列输入bert模型，经过多层转换器trm(transfomer)的双向深度交互后，获取最后一层trm的输出在token序列对应位置的向量，作为用户问句的向量表示。查询用户画像库中是否存在第三用户的第三画像，若存在，则将用户问句的向量表示和第三画像组成查询向量，利用查询向量查询预设的知识问答库，得到与查询向量的相似度大于或等于预设值的向量集合，将该向量集合对应的所有问句作为参考用户问句，得到至少一个参考用户问句。可选的，知识问答库中的问句可以是语料数据库中的问句，这些问句事先可采用bert模型将其转化为对应的语义向量表示，并可根据这些问句对应的用户画像对语义向量表示进行分区存储，比如：第一用户的用户问句的语义向量表示可单独存储在一个区域，以备查询时使用，其中，分区方式可使用哈希分桶法，或k均值等聚类算法，此处不作限定。
[0069]
具体的，假设至少一个参考用户问句包括参考用户问句1、参考用户问句2和参考用户问句3，将参考用户问句1与用户问句拼接为第一问句对，比如：[cls]这个商品好么[sep]今天天气怎么样，获取第一问句对的token序列，将该token序列输入bert模型进行处理，得到输出向量，将该输出向量输入全连接层进行二分类，得到输出结果，比如：该输出结果可表示为[0.1,0.9]，其中，第一个元素，即元素0.1表示参考用户问句1与用户问句的相似得分，第二个元素，即0.9表示参考用户问句1与用户问句的不相似得分。应理解，对于参考用户问句2和参考用户问句3同样分别与用户问句拼接为问句对，由此，可得到至少一个问句对中每个问句对的相似得分，将相似得分最高的问句对中的参考用户问句确定为目标用户问句，比如：参考用户问句3与用户问句的相似得分最高，则参考用户问句3为目标用户问句。
[0070]
示例性的，在上述知识问答库中不存在与上述用户问句的相似度大于或等于预设
值的参考用户问句的情况下，向上述业务专家推送用户问句，然后获取业务专家对上述用户问句的回答，向第三用户返回业务专家对用户问句的回答，并将用户问句和业务专家对用户问句的回答添加至上述知识问答库中，以对知识问答库进行扩充。
[0071]
可以看出，在本技术实施例中，通过获取第一用户与业务专家的第一对话数据和业务专家对第一用户的第一个性打分数据；根据第一对话数据和第一个性打分数据得到第一语料数据；根据第一用户的第一历史对话数据，得到第一用户的第一词频特征向量和第一个性特征向量，第一历史对话数据包括第一对话数据；获取第一用户的基本信息，根据第一用户的基本信息、第一词频特征向量和第一个性特征向量，生成第一用户的第一画像；获取第一用户与第二用户对话的第二语料数据，第二语料数据包括第一用户与第二用户的第二对话数据、第一用户对第二用户的第二个性打分数据和第二用户对第一用户的第三个性打分数据；根据第一语料数据、第二对话数据、第二个性打分数据和第三个性打分数据，得到第三语料数据；采用第一画像和第三语料数据构建智能问答系统。这样采用融入了个性特征(即第一个性特征向量)的画像构建方式构建第一画像，再采用第一画像构建智能问答系统，有利于使智能问答系统更具针对性的进行对话，另外，第三语料数据是采用第二对话数据、第二个性打分数据和第三个性打分数据对第一语料数据进行扩充得到的，不仅能够使语料数据更全面，且在语料数据中融入了个性特征(即第二个性打分数据和第三个性打分数据)，采用更全面的语料数据和具有个性特征的用户画像训练智能问答系统，有利于提升智能问答系统对话的准确性和对话效果。
[0072]
参阅图5，图5为本技术实施例提供的另一种智能问答系统构建方法的流程示意图，如图5所示，该方法包括步骤501-511：
[0073]
501：获取第一用户与业务专家的第一对话数据和所述业务专家对所述第一用户的第一个性打分数据；
[0074]
502：根据所述第一对话数据和所述第一个性打分数据得到第一语料数据；
[0075]
503：根据所述第一用户的第一历史对话数据，得到所述第一用户的第一词频特征向量和第一个性特征向量，所述第一历史对话数据包括所述第一对话数据；
[0076]
504：获取所述第一用户的基本信息，根据所述第一用户的基本信息、所述第一词频特征向量和所述第一个性特征向量，生成所述第一用户的第一画像；
[0077]
505：获取所述第一用户与第二用户对话的第二语料数据，所述第二语料数据包括所述第一用户与所述第二用户的第二对话数据、所述第一用户对所述第二用户的第二个性打分数据和所述第二用户对所述第一用户的第三个性打分数据；
[0078]
506：根据所述第一语料数据、所述第二对话数据、所述第二个性打分数据和所述第三个性打分数据，得到第三语料数据；
[0079]
507：采用所述第一画像和所述第三语料数据构建智能问答系统；
[0080]
508：获取第三用户向所述智能问答系统输入的用户问句，以及获取所述用户问句的向量表示；
[0081]
示例性的，用户问句可以是针对某商品的问题，可选的，第三用户输入的用户问句可以是语音，具体可采用语音识别模型将该语音转换为相应的文本。对于第三用户输入的用户问句，可采用nlp表示模型进行编码，得到对应的向量表示。
[0082]
509：在所述用户画像库中存在所述第三用户的第三画像的情况下，基于所述用户
问句的向量表示和所述第三画像，从知识问答库中查询得到与所述用户问句的相似度大于或等于预设值的至少一个参考用户问句；
[0083]
示例性的，在上述用户画像库中查询到第三用户的第三画像后，再基于第三画像和用户问句的向量表示组成查询向量，基于查询向量查询预设的知识问答库中，得到与查询向量相似度大于或等于预设值的向量集合，将该向量集合对应的所有问句作为参考用户问句，得到至少一个参考用户问句。
[0084]
510：基于所述用户问句和所述至少一个参考用户问句，从所述至少一个参考用户问句中确定出目标用户问句；
[0085]
示例性的，基于用户问句和至少一个参考用户问句，从至少一个参考用户问句中确定出目标用户问句，具体包括：将至少一个参考用户问句分别与用户问句拼接，得到至少一个问句对；采用自然语言处理技术对至少一个问句对进行二分类，得到至少一个问句对中每个问句对的相似度得分；确定至少一个问句对中相似度得分最高的问句对，将相似度得分最高的问句对中的参考用户问句确定为目标用户问句。
[0086]
可选的，在知识问答库中不存在与用户问句的相似度大于或等于所述预设值的参考用户问句的情况下，向业务专家推送所述用户问句；获取业务专家对所述用户问句的回答；向第三用户返回业务专家对所述用户问句的回答，以及将用户问句和业务专家对用户问句的回答添加至知识问答库，以对知识问答库进行扩充。
[0087]
511：向所述第三用户返回所述目标用户问句对应的回答。
[0088]
其中，步骤501-511的具体实施方式，在图1所示的实施例中已有相关说明，且能达到相同或相似的有益效果，此处不再赘述。
[0089]
参阅图6，图6为本技术实施例提供的一种智能问答系统构建装置结构示意图，如图6所示，该智能问答系统构建装置600包括：获取模块601、存储模块602、特征提取模块603、用户画像模块604和搭建模块605。
[0090]
获取模块601，用于获取第一用户和业务专家的第一对话数据和业务专家对第一用户的第一个性打分数据；
[0091]
存储模块602，用于根据第一对话数据和第一个性打分数据得到第一语料数据；
[0092]
特征提取模块603，用于根据第一用户的第一历史对话数据，得到第一用户的第一词频特征向量和第一个性特征向量，第一历史对话数据包括第一对话数据；
[0093]
用户画像模块604，用于获取第一用户的基本信息，根据第一用户的基本信息、第一词频特征向量和第一个性特征向量，生成第一用户的第一画像；
[0094]
获取模块601，还用于获取第一用户与第二用户对话的第二语料数据，第二语料数据包括第一用户和第二用户的第二对话数据、第一用户对第二用户的第二个性打分数据和第二用户对第一用户的第三个性打分数据；
[0095]
储存模块602，还用于根据第一语料数据、第二个性打分数据和第三个性打分数据得到的第三语料数据；
[0096]
搭建模块605，用于采用第一画像和第三语料数据搭建智能问答系统。
[0097]
在一种可能的实施方式中，在根据所述第一用户的第一历史对话数据，得到所述第一用户的第一词频特征向量和第一个性特征向量方面，特征提取模块603具体用于：
[0098]
获取所述第一历史对话数据中每个词语出现的频率，将所述每个词语出现的频率
确定为所述第一词频特征向量；
[0099]
基于预设的个性标签列表，对所述第一历史对话数据进行个性编码，得到所述第一个性特征向量。
[0100]
在一种可能的实施方式中，用户画像模块604还用于：
[0101]
获取所述第二用户与所述业务专家的第三对话数据；
[0102]
根据所述第二用户的第二历史对话数据，得到所述第二用户的第二词频特征向量和第二个性特征向量，所述第二历史对话数据包括所述第三对话数据；
[0103]
获取第二用户的基本信息，根据所述第二用户的基本信息、所述第二词频特征向量和所述第二个性特征向量，生成所述第二用户的第二画像，将所述第二画像添加至用户画像库。
[0104]
在一种可能的实施方式中，搭建模块605还用于：
[0105]
获取第三用户向所述智能问答系统输入的用户问句，以及获取所述用户问句的向量表示；
[0106]
在所述用户画像库中存在所述第三用户的第三画像的情况下，基于所述用户问句的向量表示和所述第三画像，从知识问答库中查询得到与所述用户问句的相似度大于或等于预设值的至少一个参考用户问句；
[0107]
基于所述用户问句和所述至少一个参考用户问句，从所述至少一个参考用户问句中确定出目标用户问句；
[0108]
向所述第三用户返回所述目标用户问句对应的回答。
[0109]
在一种可能的实施方式中，在基于所述用户问句和所述至少一个参考用户问句，从所述至少一个参考用户问句中确定出目标用户问句方面，搭建模块605具体用于：
[0110]
将所述至少一个参考用户问句分别与所述用户问句拼接，得到至少一个问句对；
[0111]
采用自然语言处理技术对所述至少一个问句对进行二分类，得到所述至少一个问句对中每个问句对的相似度得分；
[0112]
确定所述至少一个问句对中相似度得分最高的问句对，将相似度得分最高的问句对中的参考用户问句确定为所述目标用户问句。
[0113]
在一种可能的实施方式中，搭建模块605还用于：
[0114]
向所述业务专家推送所述用户问句；
[0115]
获取所述业务专家对所述用户问句的回答；
[0116]
向所述第三用户返回所述业务专家对所述用户问句的回答，以及将所述用户问句和所述业务专家对所述用户问句的回答添加至所述知识问答库。
[0117]
在一种可能的实施方式中，获取模块601还用于：
[0118]
获取预先构建的用户推荐系统基于所述第一画像，为所述第一用户推荐的所述第二用户；
[0119]
在一种可能的实施方式中，搭建模块605还用于：
[0120]
对所述第一画像进行编码，得到第一编码向量；
[0121]
对所述第二画像进行编码，得到第二编码向量；
[0122]
对所述第一用户与所述第二用户对话时发起的话题进行编码，得到第三编码向量；
[0123]
采用所述第一编码向量、所述第二编码向量、所述第三编码向量及所述第一用户对所述用户推荐系统的推荐效果的打分值，训练所述用户推荐系统。
[0124]
根据本技术的一个实施例，图6所示的智能问答系统构建装置的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本技术的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本技术的其它实施例中，基于病理切片图像处理装置也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。
[0125]
根据本技术的另一个实施例，可以通过在包括中央处理单元(central processing unit，cpu)、随机存取存储介质(random access memory，ram)、只读存储介质(read-only memory，rom)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图1或图5中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图6中所示的智能问答系统构建装置设备，以及来实现本技术实施例的智能问答系统构建方法。所述计算机程序可以记载于例如计算机可读记录介质上，并通过计算机可读记录介质装载于上述计算设备中，并在其中运行。
[0126]
参阅图7，图7为本技术实施例提供的一种电子设备的结构示意图。如图7所示，电子设备700包括收发器701、处理器702和存储器703。它们之间通过总线704连接。存储器703用于存储计算机程序和数据，并可以将存储器703存储的数据传输给处理器702。
[0127]
处理器702用于读取存储器703中的计算机程序执行以下操作：
[0128]
获取第一用户与业务专家的第一对话数据和业务专家对第一用户的第一个性打分数据；
[0129]
根据第一对话数据和第一个性打分数据得到第一语料数据；
[0130]
根据第一用户的第一历史对话数据，得到第一用户的第一词频特征向量和第一个性特征向量，第一历史对话数据包括第一对话数据；
[0131]
获取第一用户的基本信息，根据第一用户的基本信息、第一词频特征向量和第一个性特征向量，生成第一用户的第一画像；
[0132]
获取第一用户与第二用户对话的第二语料数据，第二语料数据包括第一用户与第二用户的第二对话数据、第一用户对第二用户的第二个性打分数据和第二用户对第一用户的第三个性打分数据；
[0133]
根据第一语料数据、第二对话数据、第二个性打分数据和第三个性打分数据，得到第三语料数据；
[0134]
采用第一画像和第三语料数据构建智能问答系统。
[0135]
示例性的，上述电子设备700可以是电脑、服务器、云服务器、计算机主机、服务器集群等，电子设备700包括但不限于收发器701、处理器702和存储器703，本领域技术人员可以理解，所述示意图仅仅是电子设备700的示例，并不构成对电子设备700的限定，其可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件。
[0136]
需要说明的是，由于电子设备700的处理器701执行计算机程序时实现上述的智能问答系统构建方法中的步骤，因此上述智能问答系统构建方法的实施例均适用于该电子设
备，且均能达到相同或相似的有益效果。
[0137]
本技术实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种智能问答系统构建方法的部分或全部步骤。
[0138]
本技术实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种智能问答系统构建方法的部分或全部步骤。
[0139]
需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本技术并不受所描述的动作顺序的限制，因为依据本技术，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本技术所必须的。
[0140]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
[0141]
在本技术所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。
[0142]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0143]
另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。
[0144]
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储器包括：u盘、只读存储器rom、随机存取存储器ram、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0145]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器rom、随机存取器ram、磁盘或光盘等。
[0146]
以上对本技术实施例进行了详细介绍，本文中应用了具体个例对本技术的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本技术的方法及其核心思想；
同时，对于本领域的一般技术人员，依据本技术的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本技术的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：任务处理方法、装置、电子设备以及存储介质与流程

一种智能问答系统构建方法及相关设备与流程

相关文献

最热文献