技术新讯 > 计算推算,计数设备的制造及其应用技术 > 多轮对话模型的训练数据构建方法、装置及电子设备与流程 > 正文

多轮对话模型的训练数据构建方法、装置及电子设备与流程

国知局
2024-09-05 14:53:39

本说明书一个或多个实施例涉及人工智能，尤其涉及一种多轮对话模型的训练数据构建方法、装置及电子设备。

背景技术：

1、在人工智能领域，尤其是自然语言处理(nlp)技术的发展中，大模型在多轮对话场景下的应用已成为研究和实践的热点。多轮对话技术的核心在于通过连续的交互，使得模型能够理解并适应用户的意图和上下文，从而提供更加准确和个性化的回复。

2、目前，在多轮对话训练数据构造方面的技术主要依赖于规则驱动的方法和基于少量标注数据的监督学习。然而在教育场景下，由于对话的复杂性和多样性，以上方法在实际应用中泛化能力和适应性不足，难以提供稳定和高质量的对话体验。

技术实现思路

1、有鉴于此，本说明书一个或多个实施例提供一种多轮对话模型的训练数据构建方法、装置及电子设备，以构建满足教育场景下用户需求的多样性的多轮对话模型的训练数据。

2、为实现上述目的，本说明书一个或多个实施例提供技术方案如下：

3、根据本说明书一个或多个实施例的第一方面，提出了一种多轮对话模型的训练数据构建方法，包括：

4、获取在教育场景下的对话数据；

5、在所述对话数据为多轮对话数据的情况下，在续轮对话中提问的长度小于第一设定阈值的情况下进入第一处理分支，否则进入第二处理分支；

6、在所述第一处理分支中，根据所述提问中所包含的关键词，得到所述续轮对话的分类结果；在所述第二处理分支中，根据所述提问的语法结构、所述提问与上一轮回答的上下文关系和所包含的关键词，得到所述续轮对话的分类结果；

7、根据所述续轮对话的分类结果，确定所述对话数据的分类结果；

8、根据所述分类结果得到分类训练数据，所述分类训练数据用于在相应类别下对所述多轮对话模型进行训练。

9、在一些实施例中，所述根据所述提问中所包含的第一设定关键词，得到所述续轮对话的分类结果，包括：

10、在所述关键词包含表征要求重复的词的情况下，确定所述分类结果指示要求重述类别；

11、在所述关键词包含口语应答词的情况下，确定所述分类结果指示无意义口语类别。

12、在一些实施例中，所述根据所述提问的语法结构、所述提问与上一轮回答的上下文关系和所包含的关键词中的至少一项，得到所述续轮对话的分类结果，包括：

13、在所述提问中包含主谓宾成分的情况下，进入第一子处理分支；否则，进入第二子处理分支；

14、在所述第一子处理分支中，根据所述提问所包含的关键词进行分类；

15、在所述第二子处理分支中，根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类。

16、在一些实施例中，在所述第一子处理分支中，根据所述提问所包含的关键词进行分类，包括：

17、若所述关键词包含自称代词和表征评价的词，确定所述分类结果指示用户自我评价类别，否则确定所述分类结果指示多轮单次问答类别。

18、在一些实施例中，在所述第二子处理分支中，根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类，包括：

19、若所述提问与上一轮回答的重复比例高于第二设定阈值，则确定所述分类结果指示无意义重复类别；

20、若所述提问中出现上一轮回答的词或短句的次数满足设定要求且所述关键词包含表征要求说明的词，则确定所述分类结果指示细节追问类别；

21、否则，判断所述关键词中是否包含表征评价的词，若包含则确定所述分类结果指示评价模型回复类别，否则确定所述分类结果指示多轮单次问答类别。

22、在一些实施例中，所述方法还包括：在所述对话数据中存在分类结果不同的续轮对话的情况下，将出现次数最多的分类结果作为所述对话数据的分类结果。

23、在一些实施例中，所述方法还包括：在所述对话数据为单轮对话数据或者多轮单次问答数据的情况下，根据提问的问题类型对得到所述对话数据的分类结果，所述问题类型包括知识点询问、作业帮助、学习策略中的至少一种。

24、根据本说明书一个或多个实施例的第二方面，提出了一种多轮对话模型的训练数据构建装置，包括：

25、获取单元，用于获取在教育场景下的对话数据；

26、判断单元，用于在所述对话数据为多轮对话数据的情况下，在续轮对话中提问的长度小于第一设定阈值的情况下进入第一处理分支，否则进入第二处理分支；

27、分类单元，用于在所述第一处理分支中，根据所述提问中所包含的关键词，得到所述续轮对话的分类结果；在所述第二处理分支中，根据所述提问的语法结构、所述提问与上一轮回答的上下文关系和所包含的关键词，得到所述续轮对话的分类结果；

28、确定单元，用于根据所述续轮对话的分类结果，确定所述对话数据的分类结果；

29、构建单元，用于根据所述分类结果得到分类训练数据，所述分类训练数据用于在相应类别下对所述多轮对话模型进行训练。

30、在一些实施例中，所述分类单元具体用于：

31、在所述关键词包含表征要求重复的词的情况下，确定所述分类结果指示要求重述类别；

32、在所述关键词包含口语应答词的情况下，确定所述分类结果指示无意义口语类别。

33、在一些实施例中，所述分类单元具体用于：

34、在所述提问中包含主谓宾成分的情况下，进入第一子处理分支；否则，进入第二子处理分支；

35、在所述第一子处理分支中，根据所述提问所包含的关键词进行分类；

36、在所述第二子处理分支中，根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类。

37、在一些实施例中，所述分类单元在用于根据所述提问所包含的关键词进行分类时，具体用地：

38、若所述关键词包含自称代词和表征评价的词，确定所述分类结果指示用户自我评价类别，否则确定所述分类结果指示多轮单次问答类别。

39、在一些实施例中，所述分类单元在用于根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类时，具体用于：

40、若所述提问与上一轮回答的重复比例高于第二设定阈值，则确定所述分类结果指示无意义重复类别；

41、若所述提问中出现上一轮回答的词或短句的次数满足设定要求且所述关键词包含表征要求说明的词，则确定所述分类结果指示细节追问类别；

42、否则，判断所述关键词中是否包含表征评价的词，若包含则确定所述分类结果指示评价模型回复类别，否则确定所述分类结果指示多轮单次问答类别。

43、在一些实施例中，所述装置还包括更新单元，用于：

44、在所述对话数据中存在分类结果不同的续轮对话的情况下，将出现次数最多的分类结果作为所述对话数据的分类结果。

45、在一些实施例中，所述装置还包括细化单元，用于：

46、在所述对话数据为单轮对话数据或者多轮单次问答数据的情况下，根据提问的问题类型对得到所述对话数据的分类结果，所述问题类型包括知识点询问、作业帮助、学习策略中的至少一种。

47、根据本说明书一个或多个实施例的第三方面，提出了一种电子设备，包括：

48、处理器；

49、用于存储处理器可执行指令的存储器；

50、其中，所述处理器通过运行所述可执行指令以实现上述实施例提出的方法的步骤。

51、根据本说明书一个或多个实施例的第四方面，提出了一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现上述实施例提出的方法的步骤。

52、根据本说明书一个或多个实施例的第五方面，提出了一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现上述实施例提出的方法的步骤。

53、在本说明书实施例中，首先获取在教育场景下的对话数据，在多轮对话的情况下，根据续轮对话中提问的长度进入不同的处理分支。在第一处理分支中，根据提问中所包含的第一设定关键词对该续轮对话进行分类；在第二处理分支中，根据提问的语法结构、所述提问与上一轮回答的上下文关系和所包含的关键词，对该续轮对话进行分类。之后根据续轮对话的分类结果，确定所获取的对话数据的分类结果，并根据所述分类结果得到用于在相应类别下对所述多轮对话模型进行训练的训练数据。通过综合考虑多种因素对教育场景下的对话数据进行分类以得到训练数据，可以使所训练的模型更加精准地理解用户在教育场景下的具体需求，提供更高质量的回答，从而提供更好的用户体验和教学效果。