一种基于孪生模型的康复场景大模型训练方法与流程
- 国知局
- 2024-07-11 17:40:58
本发明属于大模型领域,尤其涉及一种基于孪生模型的康复场景大模型训练方法。
背景技术:
1、康复医疗是一项重要的医疗服务,可以帮助患者恢复功能、改善生活质量。然而,目前康复医疗仍然面临一些挑战和问题,主要面临以下几个问题:1)随着老龄化程度、慢性病患者增加的原因,导致康复医疗的需求越来越大;2)康复医疗需要大量的人力物力资源,导致医疗资源短缺,患者难以得到及时和有效的康复治疗;3)目前康复治疗的效果评估通常基于临床医生的主观判断,而缺乏客观、标准化的评估方法;4)康复治疗通常是根据临床常规方案来制定,缺乏针对患者的个性化治疗方案;5)康复治疗通常是一个长期的过程,但是难以对康复治疗的效果进行量化分析,缺乏科学和可靠的数据支持和证明。
2、数字孪生模型可以利用虚拟仿真技术对物理实体进行数字化呈现,能够对物理实体进行全生命周期的建模、仿真和优化。在康复领域,数字孪生模型可以帮助医护人员进行个性化诊断和治疗,提高治疗效果和效率。数字孪生模型可以对患者的身体做全面的健康监测,收集大量的数据,通过人工智能等方法进行分析,为医护人员提供更准确的诊断和治疗建议。另外,数字孪生模型也可以用于康复后的管理和评估,医护人员可以基于数字孪生模型对康复效果进行评估和优化治疗方案。面对康复医疗中的诸多问题,孪生模型提供了一个很好的技术手段。
3、目前,以chatgpt为代表的大模型方法展现的优良表现迅速得到关注,并且也为康复领域提供了广阔的应用前景。例如在运动康复和语音康复中,医疗机构需要使用大规模的数据来训练模型,以确定最佳的康复计划和方案,提高康复效果。由于大模型方法可以学习丰富的知识,所以可以同时应用于多种康复中。
4、所以,针对康复中的诸多问题,如何利用孪生模型和大模型方法的特点,是一个很有意义的工作。
技术实现思路
1、针对现有技术存在的问题,本申请实施例的目的是提供一种基于孪生模型的康复场景大模型训练方法。
2、根据本申请实施例的第一方面,提供一种基于孪生模型的康复场景大模型训练方法,包括:
3、s1:获取训练数据集并进行处理,所述训练数据集中包括康复临床数据、孪生模型数据和多学科数据;
4、s2:获取待训练大模型,基于处理后的训练数据集,利用自监督学习方法训练所述待训练模型;
5、s3:对于步骤s2训练后的大模型,基于处理后的康复临床数据和孪生模型数据,利用监督学习方法和规范化模板进行进一步训练;
6、s4:对于步骤s3训练后的大模型,基于处理后的康复临床数据,利用强化学习方法进行进一步训练大模型,其中强化学习过程中以人工反馈及相关数据作为评分机制,以引导大模型生成用户认可的创意性回答。
7、进一步地,所述康复临床数据包括诊断数据、患者数据、康复场景中机器人和摄像头的监测数据、医学理论数据,所述孪生模型数据包括文本、视频、语音,从标注数据集、互联网基础语料库或其他公开渠道获得;所述多学科数据为利用多模态数据得到的多领域数据,领域包括视觉、语音、文学、法律、科学、艺术、编程、数学。
8、进一步地,所述孪生模型数据通过孪生数字人模型在孪生仿真环境获取。
9、进一步地,所述待训练大模型是clip模型、med-palm模型或llama模型。
10、进一步地,步骤s3中,所述规范化模板为人工根据实际对话模板需求写好的对话范例。
11、进一步地,步骤s4中,在强化学习的过程中,对于符合人类预期的输出设置即时奖励为1,不符合人类预期的输出设置即时奖励为0。
12、根据本申请实施例的第二方面,提供一种基于孪生模型的康复场景大模型训练装置,包括:
13、数据获取模块,用于获取训练数据集并进行处理,所述训练数据集中包括康复临床数据、孪生模型数据和多学科数据;
14、自监督学习模块,用于获取待训练大模型,基于处理后的训练数据集,利用自监督学习方法训练所述待训练模型;
15、监督学习模块,用于对于步骤s2训练后的大模型,基于处理后的康复临床数据和孪生模型数据,利用监督学习方法和规范化模板进行进一步训练;
16、强化学习模块,用于对于步骤s3训练后的大模型,基于处理后的康复临床数据,利用强化学习方法进行进一步训练大模型,其中强化学习过程中以人工反馈及相关数据作为评分机制,以引导大模型生成用户认可的创意性回答。
17、根据本申请实施例的第三方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法。
18、根据本申请实施例的第四方面,提供一种电子设备,包括:
19、一个或多个处理器;
20、存储器,用于存储一个或多个程序;
21、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的方法。
22、根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面所述方法的步骤。
23、本申请的实施例提供的技术方案可以包括以下有益效果:
24、由上述实施例可知,本申请提出了一种应用于康复场景中的大模型训练方法,改善模型训练的有效性,进而提高治疗效果;同时,本发明利用数字孪生技术提供更多的数据样本,利用孪生场景生成大量有效的虚拟数据,进而减少对真实数据的依赖。
25、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
技术特征:1.一种基于孪生模型的康复场景大模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述康复临床数据包括诊断数据、患者数据、康复场景中机器人和摄像头的监测数据、医学理论数据,所述孪生模型数据包括文本、视频、语音,从标注数据集、互联网基础语料库或其他公开渠道获得;所述多学科数据为利用多模态数据得到的多领域数据,领域包括视觉、语音、文学、法律、科学、艺术、编程、数学。
3.根据权利要求1所述的方法,其特征在于,所述孪生模型数据通过孪生数字人模型在孪生仿真环境获取。
4.根据权利要求1所述的方法,其特征在于,所述待训练大模型是clip模型、med-palm模型或llama模型。
5.根据权利要求1所述的方法,其特征在于,步骤s3中,所述规范化模板为人工根据实际对话模板需求写好的对话范例。
6.根据权利要求1所述的方法,其特征在于,步骤s4中,在强化学习的过程中,对于符合人类预期的输出设置即时奖励为1,不符合人类预期的输出设置即时奖励为0。
7.一种基于孪生模型的康复场景大模型训练装置,其特征在于,包括:
8.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法。
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-6中任一项所述方法的步骤。
技术总结本发明公开了一种基于孪生模型的康复场景大模型训练方法,包括:获取训练数据集并进行处理,所述训练数据集中包括康复临床数据、孪生模型数据和多学科数据;获取待训练大模型,基于处理后的训练数据集,利用自监督学习方法训练所述待训练模型;对于自监督学习后的大模型,基于处理后的康复临床数据和孪生模型数据,利用监督学习方法和规范化模板进行进一步训练;对于监督学习后的大模型,基于处理后的康复临床数据,利用强化学习方法进行进一步训练大模型,其中强化学习过程中以人工反馈及相关数据作为评分机制,以引导大模型生成用户认可的创意性回答。技术研发人员:李帅龙,林峰,马萧,薛均晓,严笑然,张晴,陆亚飞受保护的技术使用者:之江实验室技术研发日:技术公布日:2024/6/11本文地址:https://www.jishuxx.com/zhuanli/20240615/85528.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。