技术新讯 > 计算推算,计数设备的制造及其应用技术 > 模型训练方法、对话控制方法、装置、存储介质及设备与流程 > 正文

模型训练方法、对话控制方法、装置、存储介质及设备与流程

国知局
2024-07-31 22:54:40

本申请涉及智能对话，尤其是涉及到一种模型训练方法、对话控制方法、装置、存储介质及设备。

背景技术：

1、大语言模型凭借其卓越的语言生成能力，能够基于接收到的输入提示创造出连贯合理、富于逻辑的文本内容。但是，现有模型训练方法不合理会使得虚拟对象(虚拟对象可以为智能客服或非玩家角色等)出现不符合角色设定或世界观逻辑的错误应答。以游戏场景为例，游戏产业正积极探索如何利用大语言模型遵循特定的叙事风格和情境设定，生成与游戏内角色相符的对话内容，从而引领着智能非玩家角色开发的新浪潮。面对那些有着深厚背景故事和鲜明人物性格的虚拟对象，确保其在与玩家交谈过程中，能够准确无误地联想到多个相关情节和设定是一项颇具挑战的任务。特别是在故事线索繁多的情况下，难以将所有剧情细节都纳入大模型的输入提示中，从而导致非玩家角色在回答玩家问题时会出现不符合角色设定或世界观逻辑的错误应答。

技术实现思路

1、有鉴于此，本申请实施例提供了一种模型训练方法、对话控制方法、装置、存储介质及计算机设备，有助于保证虚拟对象在与玩家交互时能够展示更多人物特色和故事细节，并且避免出现不符合角色设定或世界观逻辑的错误应答，提高了虚拟对象与玩家对话的内在一致性与可信度。

2、根据本申请的一个方面，提供了一种模型训练方法，所述方法包括：

3、基于目标虚拟对象的角色数据集，构建所述目标虚拟对象对应的对话训练样本集，其中，所述角色数据集包括以下至少一项：所述目标虚拟对象的认知边界数据、所述目标虚拟对象的角色设定数据以及所述目标虚拟对象的背景故事数据；所述认知边界数据至少包括所述目标虚拟对象与其他对象针对超出预设知识范围外的话题的对话数据；所述对话训练样本集至少包括：目标虚拟对象与其他对象的对话数据；

4、基于所述对话训练样本集对语言模型进行训练，得到与所述目标虚拟对象对应的对话模型。

5、依据本申请又一个方面，提供了一种虚拟对象的对话控制方法，包括：

6、响应于其他对象向目标虚拟对象发起的对话指令，确定其他对象向目标虚拟对象发起的目标问题数据；

7、调用与所述目标虚拟对象关联的对话模型，生成所述目标问题数据对应的目标应答数据；其中，与所述目标虚拟对象关联的对话模型是基于对话训练样本集对语言模型进行训练得到，且对话训练样本集是基于目标虚拟对象的角色数据集构建的；所述角色数据集包括以下至少一项：所述目标虚拟对象的认知边界数据、所述目标虚拟对象的角色设定数据以及所述目标虚拟对象的背景故事数据；所述认知边界数据至少包括所述目标虚拟对象与其他对象针对超出预设知识范围外的话题的对话数据；所述对话训练样本集至少包括：目标虚拟对象与其他对象的对话数据；

8、输出所述目标应答数据。

9、依据本申请又一个方面，提供了一种模型训练装置，所述装置包括：

10、样本构建模块，用于基于目标虚拟对象的角色数据集，构建所述目标虚拟对象对应的对话训练样本集，其中，所述角色数据集包括以下至少一项：所述目标虚拟对象的认知边界数据、所述目标虚拟对象的角色设定数据以及所述目标虚拟对象的背景故事数据；所述认知边界数据至少包括所述目标虚拟对象与其他对象针对超出预设知识范围外的话题的对话数据；所述对话训练样本集至少包括：目标虚拟对象与其他对象的对话数据；

11、模型训练模块，用于基于所述对话训练样本集对语言模型进行训练，得到与所述目标虚拟对象对应的对话模型。

12、依据本申请又一个方面，提供了一种虚拟对象的对话控制装置，包括：

13、对话响应模块，响应于其他对象向目标虚拟对象发起的对话指令，确定其他对象向目标虚拟对象发起的目标问题数据；

14、应答模块，调用与所述目标虚拟对象关联的对话模型，生成所述目标问题数据对应的目标应答数据；其中，与所述目标虚拟对象关联的对话模型是基于对话训练样本集对语言模型进行训练得到，且对话训练样本集是基于目标虚拟对象的角色数据集构建的；所述角色数据集包括以下至少一项：所述目标虚拟对象的认知边界数据、所述目标虚拟对象的角色设定数据以及所述目标虚拟对象的背景故事数据；所述认知边界数据至少包括所述目标虚拟对象与其他对象针对超出预设知识范围外的话题的对话数据；所述对话训练样本集至少包括：目标虚拟对象与其他对象的对话数据；

15、输出模块，输出所述目标应答数据。

16、依据本申请又一个方面，提供了一种存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述模型训练方法。

17、依据本申请再一个方面，提供了一种计算机设备，包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述模型训练方法。

18、借由上述技术方案，本申请实施例提供的一种模型训练方法、装置、存储介质及计算机设备，首先，收集关于目标虚拟对象的角色数据集，包含认知边界、角色设定和背景故事等多方面信息，其次，根据角色数据集制作特定的对话训练样本集，最后，利用预训练的大语言模型进行增量训练，从而获得针对目标虚拟对象定制的对话模型。本申请实施例不再受限于大模型输入的较短提示词长度，而是通过构建角色数据集从而构建样本进行大语言模型的增量训练，以便模型能够保存虚拟对象详细丰富的背景故事和人物特性信息，而不是仅仅依赖高度提炼的提示词，极大地减少了信息损失，保证了虚拟对象在与玩家交互时能够展示更多细腻且完整的人物特色和故事细节，并且避免出现不符合角色设定或世界观逻辑的错误应答，提高了虚拟对象与玩家对话的内在一致性与可信度。从而不仅克服了传统方法在处理复杂虚拟对象背景故事和人物特性时面临的局限性，还能够提升游戏内的虚拟对象智能化程度和玩家的游戏体验。

19、上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

技术特征：

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述角色数据集包括以下至少一个数据集：

3.根据权利要求1或2所述的方法，其特征在于，当所述角色数据集包括认知边界数据集时，基于目标虚拟对象的角色数据集，构建所述目标虚拟对象对应的对话训练样本集的步骤之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，根据所述认知边界数据提示词，通过语言模型构建所述认知边界数据集包括：

5.根据权利要求4所述的方法，其特征在于，所述认知边界数据提示词至少包括以下至少一项：

6.根据权利要求1或2所述的方法，其特征在于，当所述角色数据集包括角色设定数据集时，基于目标虚拟对象的角色数据集，构建所述目标虚拟对象对应的对话训练样本集的步骤之前，所述方法还包括：

7.根据权利要求1或2所述的方法，其特征在于，当所述角色数据集包括背景故事数据集时，基于目标虚拟对象的角色数据集，构建所述目标虚拟对象对应的对话训练样本集的步骤之前，所述方法还包括：

8.根据权利要求1所述的方法，其特征在于，所述基于目标虚拟对象的角色数据集，构建所述目标虚拟对象对应的对话训练样本集，包括：

9.根据权利要求8所述的方法，其特征在于，所述基于预设单轮数据集训练次数、预设多轮数据集训练次数、所述单轮数据集和所述多轮数据集，构建所述目标虚拟对象对应的对话训练样本集，包括：

10.根据权利要求8所述的方法，其特征在于，所述基于预设单轮数据集训练次数、预设多轮数据集训练次数、所述单轮数据集和所述多轮数据集，构建所述目标虚拟对象对应的对话训练样本集之前，所述方法还包括：

11.根据权利要求10所述的方法，其特征在于，所述基于所述预设单轮数据集训练次数、所述预设多轮数据集训练次数、预设话题切换数据集训练次数、所述单轮数据集、所述多轮数据集和所述话题切换数据集，构建所述目标虚拟对象对应的对话训练样本集，包括：

12.根据权利要求11所述的方法，其特征在于，所述基于所述预设单轮数据集训练次数、所述预设多轮数据集训练次数、预设话题切换数据集训练次数，分别确定所述单轮数据集、所述多轮数据集和所述话题切换数据集中各条对话数据的出现次数，并按相应的出现次数对所述单轮数据集、所述多轮数据集和所述话题切换数据集中的对话数据进行混合排序，构建所述目标虚拟对象对应的对话训练样本集，包括：

13.根据权利要求11所述的方法，其特征在于，所述基于所述预设单轮数据集训练次数、所述预设多轮数据集训练次数、预设话题切换数据集训练次数，分别确定所述单轮数据集、所述多轮数据集和所述话题切换数据集中各条对话数据的出现次数，并按相应的出现次数对所述单轮数据集、所述多轮数据集和所述话题切换数据集中的对话数据进行混合排序，构建所述目标虚拟对象对应的对话训练样本集，包括：

14.一种虚拟对象的对话控制方法，其特征在于，包括：

15.一种模型训练装置，其特征在于，所述装置包括：

16.一种虚拟对象的对话控制装置，其特征在于，包括：

17.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法。

18.一种计算机设备，包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法。

技术总结本申请公开了一种模型训练方法、对话控制方法、装置、存储介质及设备，模型训练方法包括：基于目标虚拟对象的角色数据集，构建所述目标虚拟对象对应的对话训练样本集，其中，所述角色数据集包括以下至少一项：所述目标虚拟对象的认知边界数据、所述目标虚拟对象的角色设定数据以及所述目标虚拟对象的背景故事数据；所述认知边界数据至少包括所述目标虚拟对象与其他对象针对超出预设知识范围外的话题的对话数据；所述对话训练样本集至少包括：目标虚拟对象与其他对象的对话数据；基于所述对话训练样本集对语言模型进行训练，得到与所述目标虚拟对象对应的对话模型。这样，有助于避免虚拟对象出现不符合角色设定或世界观逻辑的错误应答。技术研发人员：张宏博,王潮,刘炎,覃建策,陈邦忠受保护的技术使用者：完美世界（北京）软件科技发展有限公司技术研发日：技术公布日：2024/7/29