自动驾驶车集群对抗测试方法、设备及介质
- 国知局
- 2024-10-09 14:37:59
本发明涉及自动驾驶测试,尤其是涉及一种自动驾驶车集群对抗测试方法、设备及介质。
背景技术:
1、近年来,自动驾驶系统及相关算法技术得到广泛研究,高级驾驶辅助系统(advanced driver assistance systems,adas)与自动驾驶车辆(autonomous vehicles,av)开始落地应用。相比人类驾驶员,自动驾驶技术可以有效提高车辆运行过程的安全性与交通效率。为有效评估自动驾驶车辆在行驶过程中的安全性,必须对自动驾驶车辆进行测试。
2、当前关于自动驾驶测试主要包括仿真测试与实车测试两种方案。仿真测试通过在仿真环境中构造不同场景与车辆模型,可以快速验证自动驾驶车在不同场景下的安全性,但保真度有限;实车测试包括封闭场地测试与实际道路测试,车辆在环实验具有较高保真度,但难以为自动驾驶车提供高复杂度的测试场景,实际道路测试受制于自然驾驶环境中危险场景的稀有性,在统计意义上评估自动驾驶的安全性需要百亿测试里程。
3、因此,亟需提供一种自动驾驶车辆测试方法,可为自动驾驶车提供高复杂度的测试场景,且对抗测试强度可定制,提高了针对自动驾驶车不同危险程度、稀有程度场景中测试能力。
技术实现思路
1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供了一种自动驾驶车集群对抗测试方法、设备及介质,能够提供为自动驾驶车提供高复杂度的测试场景,且对抗测试强度可定制,提高了针对自动驾驶车不同危险程度、稀有程度场景中测试能力。
2、本发明的目的可以通过以下技术方案来实现:
3、根据本发明的第一方面,提供了一种自动驾驶车集群对抗测试方法,该方法包括以下步骤:
4、步骤s1、对抗场景评估:环境车集群获取场景信息,采用风险场对场景进行刻画,并通过场演化方法推演未来对抗场景与对抗强度,若对抗强度大于阈值,则进行自动驾驶车集群对抗测试;
5、步骤s2、任务生成分配:根据专家知识构建对抗任务库,根据步骤s1中推演获得的对抗场景及对抗强度,结合环境车的状态信息及能力,为环境车生成对抗任务,同时评估所述对抗任务的威胁度;
6、步骤s3、对手建模:环境车在执行对抗任务前的初始时刻,使用跟驰模型与换道模型建模被测车;在执行对抗任务过程中,通过数据驱动方法更新对被测车的建模,获得被测车的响应策略并对被测车进行轨迹预测;
7、步骤s4、在线进化对抗:环境车执行步骤s2中分配的对抗任务,结合步骤s3中被测车的模型参数,选择对应预训练的强化学习模型,输出环境车的加速度与前轮转角控制环境车,通过最大化本车收益与被测车收益的差值,完成环境车集群与被测车的对抗测试;
8、步骤s5、循环执行:循环执行步骤s3中对手建模步骤与步骤s4中在线进化对抗步骤,持续性更新对手模型与强化学习模型,实时计算环境车的动作,直至每辆环境车完成对抗任务。
9、优选地,所述步骤s1中的场景信息包括地图信息与车辆状态信息;所述地图信息包括车辆位置信息,所述车辆状态信息包括速度信息和航向角信息。
10、优选地,所述步骤s1中采用风险场对场景进行刻画,任一车辆的风险场的计算表达式为:
11、
12、ky,p=ky,0 (4)
13、
14、
15、式中:kx,p,ky,p均为调整系数;xji,yji为i与j两车在两方向上的距离;rmax为风险影响的最远距离;r0,m为常数;vj为车辆j的速度,vj,max为车辆j的最大速度;sign(x)与sign0(x)均为符号函数。
16、优选地,所述步骤s1中,通过基于物理信息神经网络pinn的场演化方法推演未来对抗场景与对抗强度,采用被测车的风险场与环境车集群的风险场重叠区域衡量未来不同对抗场景的对抗强度,表达式为:
17、φ=∫af(x,y)ds (7)
18、式中:φ为对抗强度;ω为风险场存在重叠的区域;f(x,y)为在位置(x,y)处被测车与环境车集群风险场重叠区域的大小。
19、优选地,所述步骤s2中的对抗任务包括切入、跟驰、侧向冲突、侧向压迫和前方减速任务。
20、优选地,所述步骤s3包括以下子步骤:
21、步骤s31:环境车集群在执行对抗任务前的初始时刻,使用idm跟驰模型建模被测车,预测被测车对环境车的响应;
22、步骤s32:在执行对抗任务过程中,通过数据驱动方法更新对被测车的建模,获得被测车的响应策略并对被测车进行轨迹预测。
23、优选地,所述步骤s32具体包括:采用增广孪生博弈方法建模被测车,被测车在每个时刻执行车辆收益最大的动作;其中,车辆收益cost为安全指标costsafe、效率指标costefficiency和舒适指标costcomfort的加权和,所述安全指标costsafe为被测车veh0与环境车vehi的空间距离,所述效率指标costefficiency为被测车速度与期望速度的绝对差值,所述舒适指标costcomfort为被测车速度的二阶导的绝对值。
24、优选地,所述步骤s4中的强化学习模型为深度q网络模型,模型输入为自车与被测车的位置和速度,模型输出为自车在下一时刻应该采取的动作,动作包括前轮转角和加速度。
25、根据本发明的第二方面,提供了一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现任一项所述的方法。
26、根据本发明的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现任一项所述的方法。
27、与现有技术相比,本发明具有以下有益效果:
28、(1)本发明提出的一种自动驾驶车集群对抗测试方法,控制多辆环境车对自动驾驶车进行测试,相比传统测试方法,该方法仅生成驾驶危险场景且测试场景的风险程度更高,回避了传统测试中的维度灾难问题。
29、(2)本发明包含了场景评估与任务生成步骤,通过为环境车集群分配不同任务,能够定制化调节测试对抗强度,保证测试场景多样性,应对不同测试需求。
30、(3)本发明包含了对手建模与在线进化对抗步骤,根据每个时间戳被测车动作反馈建模被测车策略,实时调整环境车的动作,可以有效应对自动驾驶车智能度等级不同或自动驾驶车策略升级等问题,确保集群对抗测试的有效性。
技术特征:1.一种自动驾驶车集群对抗测试方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的一种自动驾驶车集群对抗测试方法,其特征在于,所述步骤s1中的场景信息包括地图信息与车辆状态信息;所述地图信息包括车辆位置信息,所述车辆状态信息包括速度信息和航向角信息。
3.根据权利要求1所述的一种自动驾驶车集群对抗测试方法,其特征在于,所述步骤s1中采用风险场对场景进行刻画,任一车辆的风险场的计算表达式为:
4.根据权利要求1所述的一种自动驾驶车集群对抗测试方法,其特征在于,所述步骤s1中,通过基于物理信息神经网络pinn的场演化方法推演未来对抗场景与对抗强度,采用被测车的风险场与环境车集群的风险场重叠区域衡量未来不同对抗场景的对抗强度,表达式为:
5.根据权利要求1所述的一种自动驾驶车集群对抗测试方法,其特征在于,所述步骤s2中的对抗任务包括切入、跟驰、侧向冲突、侧向压迫和前方减速任务。
6.根据权利要求1所述的一种自动驾驶车集群对抗测试方法,其特征在于,所述步骤s3包括以下子步骤:
7.根据权利要求6所述的一种自动驾驶车集群对抗测试方法,其特征在于,所述步骤s32具体包括:采用增广孪生博弈方法建模被测车,被测车在每个时刻执行车辆收益最大的动作;其中,车辆收益cost为安全指标costsafe、效率指标costefficiency和舒适指标costcomfort的加权和,所述安全指标costsafe为被测车veh0与环境车vehi的空间距离,所述效率指标costefficiency为被测车速度与期望速度的绝对差值,所述舒适指标costcomfort为被测车速度的二阶导的绝对值。
8.根据权利要求1所述的一种自动驾驶车集群对抗测试方法,其特征在于,所述步骤s4中的强化学习模型为深度q网络模型,模型输入为自车与被测车的位置和速度,模型输出为自车在下一时刻应该采取的动作,动作包括前轮转角和加速度。
9.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~8任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~8中任一项所述的方法。
技术总结本发明涉及一种自动驾驶车集群对抗测试方法、设备及介质,该方法包括:初始化场景信息,获得背景车与被测车的车辆信息;建立风险场并通过场预测方法评估未来对抗强度;若未来对抗强度满足要求,根据专家知识库,为场景中背景车分配侧向压迫等对抗任务;背景车在执行对抗任务过程中,通过观察被测车信息进行对手建模,并根据建模结果选取合适预训练强化学习模型进行运动控制;背景车不断执行对抗动作,直至完成对抗任务。与现有技术相比,本发明能够提供为自动驾驶车提供高复杂度的测试场景,且对抗测试强度可定制,提高了针对自动驾驶车不同危险程度、稀有程度场景中测试能力。技术研发人员:孙剑,杭鹏,刘学凯受保护的技术使用者:同济大学技术研发日:技术公布日:2024/9/29本文地址:https://www.jishuxx.com/zhuanli/20241009/305916.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表