自动驾驶场景中智能体的决策控制方法及车辆驾驶系统与流程
- 国知局
- 2024-08-01 00:22:58
本公开涉及自动驾驶,尤其涉及一种自动驾驶场景中智能体的决策控制方法、自动驾驶场景中智能体的决策控制装置、存储介质及车辆驾驶系统。
背景技术:
1、随着智能技术发展,汽车开始向无人智能加速方向发展。其中,汽车自动驾驶系统便是无人智能驾驶的一种。其中,自动驾驶算法在研发过程中,为了提高算法研发效率,验证算法效果,通常需要使用仿真环境。为了提高仿真环境的拟真度,需要在仿真环境中模拟出各类交通参与者的行为。这些交通参与者会在其自身目的的驱使下,在彼此交互的过程中,展现出非常复杂的行为。例如,当车辆交通参与者到达它的目的地时,它可能开始靠边停车的行为。又如,当自行车交通参与者在遇到前方慢速行人时,它可能开始绕过该行人的行为。这些复杂行为往往很难在仿真系统中被模拟出来。为了能够在仿真系统中模拟各类交通参与者的行为,一般采用智能体进行各类交通参与者的行为仿真模拟。但目前智能体在复杂场景中的拟真度都不高。这将影响到自动驾驶算法的验证准确性。
技术实现思路
1、有鉴于此,本公开实施例期望提供一种自动驾驶场景中智能体的决策控制方法、自动驾驶场景中智能体的决策控制装置、存储介质及车辆驾驶系统。
2、本公开的技术方案是这样实现的:
3、第一方面,本公开提供一种自动驾驶场景中智能体的决策控制方法。
4、本公开实施例提供的自动驾驶场景中智能体的决策控制方法,包括:
5、获取大语言模型代理,其中所述大语言模型代理包含有代理配置文件、计划语言模型及批判语言模型;所述代理配置文件包含有生成所述智能体所需要的角色配置信息;
6、输入所述角色配置信息、目标规划任务所关联的驾驶任务信息,至所述计划语言模型,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线;
7、基于所述批判语言模型确定所述车辆自动驾驶时与障碍物间的距离,及基于所述距离对所述智能体的路线选择进行合理性判断,并输出所述智能体的路线选择的修正意见;
8、将所述智能体的路线选择的修正意见输入至所述计划语言模型,进行所述智能体执行所述目标规划任务时的路线选择修正,得到修正后的轨迹路线。
9、在一些实施例中,所述大语言模型代理包含有记忆库;
10、所述记忆库包括短期记忆存储和长期记忆存储;
11、所述输入所述生成所述智能体所需要的角色配置信息、目标规划任务所关联的驾驶任务信息,至所述计划语言模型,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线时,所述方法包括:
12、通过短期记忆存储记录大语言模型代理在当前交通场景下所做出的各种动作,以及对应的结果;
13、通过长期记忆存储记录大语言模型代理的所有规划经验的摘要。
14、在一些实施例中,所述大语言模型代理包含有工具库;其中,工具库中包含多种可供所述大语言模型代理调用的工具;
15、所述输入所述生成所述智能体所需要的角色配置信息、目标规划任务所关联的驾驶任务信息,至所述计划语言模型,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线时,所述方法包括:
16、通过所述工具库中的工具,在每次大语言模型代理完成一次轨迹路线规划之后,将整个规划过程中的所有动作和对应结果形成摘要。
17、在一些实施例中,所述大语言模型代理包含有微调数据集;
18、所述输入所述生成所述智能体所需要的角色配置信息、目标规划任务所关联的驾驶任务信息,至所述计划语言模型,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线后,所述方法包括:
19、当目标规划任务执行失败时,基于所述轨迹路线确定出合理的规划轨迹路线;
20、将合理的规划轨迹路线记录到所述微调数据集;其中,所述微调数据集用于对所述计划语言模型进行模型训练。
21、在一些实施例中,所述得到修正后的轨迹路线后,所述方法包括:
22、若基于所述修正后的轨迹路线执行所述目标规划任务失败,则基于所述微调数据集对所述计划语言模型进行模型训练。
23、在一些实施例中,所述得到修正后的轨迹路线后,所述方法包括:
24、获取基于所述修正后的轨迹路线执行所述目标规划任务时的任务执行情况;
25、基于所述任务执行情况,确定所述大语言模型代理驱使所述智能体进行仿真人类思维活动进行路线选择的拟真度;其中,基于所述修正后的轨迹路线执行所述目标规划任务的完成度越高,表征所述大语言模型代理驱使所述智能体进行仿真人类思维活动进行路线选择的拟真度越高。
26、在一些实施例中,所述基于所述批判语言模型确定所述车辆自动驾驶时与障碍物间的距离,包括:
27、基于所述批判语言模型调用所述工具库中的计算器;
28、通过所述计算器对所述车辆位置坐标及障碍物位置坐标进行距离计算,确定所述车辆自动驾驶时与障碍物间的距离。
29、第二方面,本公开提供一种自动驾驶场景中智能体的决策控制系统,包括:
30、大语言模型代理;所述大语言模型代理包含有代理配置文件、计划语言模型及批判语言模型;所述代理配置文件包含有生成所述智能体所需要的角色配置信息;
31、所述计划语言模型,用于根据输入的所述角色配置信息、目标规划任务所关联的驾驶任务信息,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线;
32、所述批判语言模型,用于确定所述车辆自动驾驶时与障碍物间的距离,及基于所述距离对所述智能体的路线选择进行合理性判断,并输出所述智能体的路线选择的修正意见,以供所述计划语言模型根据所述智能体的路线选择的修正意见,进行所述智能体执行所述目标规划任务时的路线选择修正,得到修正后的轨迹路线。
33、在一些实施例中,所述大语言模型代理包括记忆库;
34、所述记忆库包括短期记忆存储和长期记忆存储;
35、所述短期记忆存储,用于记录大语言模型代理在当前交通场景下所做出的各种动作,以及对应的结果;
36、所述长期记忆存储,用于记录大语言模型代理的所有规划经验的摘要。
37、在一些实施例中,所述大语言模型代理包括工具库;其中,工具库中包含多种可供所述大语言模型代理调用的工具;
38、所述工具库中的工具,用于在每次大语言模型代理完成一次轨迹路线规划之后,将整个规划过程中的所有动作和对应结果形成摘要。
39、在一些实施例中,所述大语言模型代理包括微调数据集;
40、所述微调数据集,记录有目标规划任务执行失败时,基于所述轨迹路线确定出合理的规划轨迹路线;所述微调数据集用于对所述计划语言模型进行模型训练。
41、第三方面,本公开提供一种自动驾驶场景中智能体的决策控制装置,包括:
42、信息获取模块,用于获取大语言模型代理,其中所述大语言模型代理包含有代理配置文件、计划语言模型及批判语言模型;所述代理配置文件包含有生成所述智能体所需要的角色配置信息;
43、轨迹路线确定模块,用于输入所述角色配置信息、目标规划任务所关联的驾驶任务信息,至所述计划语言模型,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线;
44、修正意见确定模块,用于基于所述批判语言模型确定所述车辆自动驾驶时与障碍物间的距离,及基于所述距离对所述智能体的路线选择进行合理性判断,并输出所述智能体的路线选择的修正意见;
45、轨迹路线修正模块,用于将所述智能体的路线选择的修正意见输入至所述计划语言模型,进行所述智能体执行所述目标规划任务时的路线选择修正,得到修正后的轨迹路线。
46、在一些实施例中,所述大语言模型代理包含有记忆库;
47、所述记忆库包括短期记忆存储和长期记忆存储;
48、所述输入所述生成所述智能体所需要的角色配置信息、目标规划任务所关联的驾驶任务信息,至所述计划语言模型,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线时,所述轨迹路线确定模块,用于
49、通过短期记忆存储记录大语言模型代理在当前交通场景下所做出的各种动作,以及对应的结果;
50、通过长期记忆存储记录大语言模型代理的所有规划经验的摘要。
51、在一些实施例中,所述大语言模型代理包含有工具库;其中,工具库中包含多种可供所述大语言模型代理调用的工具;
52、所述输入所述生成所述智能体所需要的角色配置信息、目标规划任务所关联的驾驶任务信息,至所述计划语言模型,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线时,所述轨迹路线确定模块,用于
53、通过所述工具库中的工具,在每次大语言模型代理完成一次轨迹路线规划之后,将整个规划过程中的所有动作和对应结果形成摘要。
54、在一些实施例中,所述大语言模型代理包含有微调数据集;
55、所述输入所述生成所述智能体所需要的角色配置信息、目标规划任务所关联的驾驶任务信息,至所述计划语言模型,输出所述智能体执行所述目标规划任务时仿真人类思维活动进行路线选择所生成的轨迹路线后,所述轨迹路线修正模块,用于
56、当目标规划任务执行失败时,基于所述轨迹路线确定出合理的规划轨迹路线;
57、将合理的规划轨迹路线记录到所述微调数据集;其中,所述微调数据集用于对所述计划语言模型进行模型训练。
58、在一些实施例中,所述得到修正后的轨迹路线后,所述轨迹路线修正模块,用于
59、若基于所述修正后的轨迹路线执行所述目标规划任务失败,则基于所述微调数据集对所述计划语言模型进行模型训练。
60、在一些实施例中,所述得到修正后的轨迹路线后,所述轨迹路线修正模块,用于
61、获取基于所述修正后的轨迹路线执行所述目标规划任务时的任务执行情况;
62、基于所述任务执行情况,确定所述大语言模型代理驱使所述智能体进行仿真人类思维活动进行路线选择的拟真度;其中,基于所述修正后的轨迹路线执行所述目标规划任务的完成度越高,表征所述大语言模型代理驱使所述智能体进行仿真人类思维活动进行路线选择的拟真度越高。
63、第四方面,本公开提供一种计算机可读存储介质,其上存储有自动驾驶场景中智能体的决策控制程序,该自动驾驶场景中智能体的决策控制程序被处理器执行时,实现上述第一方面所述的自动驾驶场景中智能体的决策控制方法。
64、第五方面,本公开提供一种车辆驾驶系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的自动驾驶场景中智能体的决策控制程序,所述处理器执行所述自动驾驶场景中智能体的决策控制程序时,实现上述第一方面所述的自动驾驶场景中智能体的决策控制方法。
65、根据本公开实施例的自动驾驶场景中智能体的决策控制方法,包括获取大语言模型代理,其中大语言模型代理包含有代理配置文件、计划语言模型及批判语言模型;代理配置文件包含有生成智能体所需要的角色配置信息;输入角色配置信息、目标规划任务所关联的驾驶任务信息,至计划语言模型,输出智能体执行目标规划任务时仿真人类思维活动进行路线选择的轨迹路线;基于批判语言模型确定车辆自动驾驶时与障碍物间的距离,及基于距离对智能体的路线选择进行合理性判断,并输出智能体的路线选择的修正意见;将智能体的路线选择的修正意见输入至计划语言模型,进行智能体执行目标规划任务时仿真人类思维活动进行路线选择修正,得到修正后的轨迹路线。本技术通过大语言模型代理中的角色配置信息确定智能驾驶模拟中的智能体,通过计划语言模型进行仿真人类思维活动进行路线选择,并通过批判语言模型输出智能体的路线选择的修正意见,以进行路线选择修正,得到修正后的轨迹路线,从而有利于提高智能体执行目标规划任务时仿真人类思维活动进行路线选择的正确性,提高基于轨迹路线执行目标规划任务的完成度及成功率,从而有利于提高智能驾驶模拟中智能体的拟真度。
66、本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
本文地址:https://www.jishuxx.com/zhuanli/20240730/200854.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表