技术新讯 > 计算推算,计数设备的制造及其应用技术 > 交通场景生成方法、装置及介质与流程  >  正文

交通场景生成方法、装置及介质与流程

  • 国知局
  • 2024-10-09 15:15:52

本发明涉及自动驾驶仿真,尤其涉及一种交通场景生成方法、装置及介质。

背景技术:

1、随着自动驾驶技术的不断发展,以智能算法驱动的自动驾驶车辆开始应用于实际交通中,而智能算法驱动必须由自动驾驶车辆经过大量的道路试验才能验证其安全性和可靠性。为了快速检验自动驾驶车辆以使得自动驾驶车辆能够适应各种类型的现实复杂场景,仿真测试工具被利用于执行自动驾驶仿真场景,以对各种智能算法进行充分验证。

2、自动驾驶仿真测试流程包括交通场景文件导入、仿真运行和结果分析,其中高质量的交通场景文件至关重要。动态交通场景生成方法包括基于道路采集的重构、基于规则的结构化构建和基于智能体代理的方法。

3、基于道路采集的重构方法数据真实可靠,但代价高昂且难以覆盖各种罕见场景;基于规则的结构化构建方法在同样的规则下往往表现为特定范围内的有偏场景分布,其场景覆盖能力依靠人力对规则的设计,不具有泛化性;智能体代理方法可通过手动规则、机器规划和深度学习训练实现,但现有方法存在生成平庸或不切实际场景的问题,场景生成过程的优化方向无法同时保证场景的覆盖性和合理性。

技术实现思路

1、针对上述技术问题,本发明提供了一种交通场景生成方法、装置及介质,可以使得生成的场景不偏离真实场景分布的同时更广泛地覆盖交通场景的标志性情况,并更快地发现受测的智驾算法可能存在的漏洞。

2、本发明的第一方面,提供一种交通场景生成方法,包括:

3、基于场景数据库获取仿真场景及初始模型,所述初始模型包括决策模型和判别模型;

4、运行所述仿真场景直至达到预设的单轮决策过程终止条件,在运行过程中训练并更新所述初始模型;

5、重复多轮运行所述仿真场景直至达到预设的智能体行为训练终止条件,并记录受试车表现的统计指标;

6、基于所述统计指标更新所述场景数据库。

7、在一种可能的实现方式中,所述运行所述仿真场景包括:

8、基于待测试自动驾驶算法生成所述仿真场景中的受试车行为;

9、基于所述决策模型生成所述仿真场景中的智能体行为;

10、基于所述受试车行为和所述智能体行为生成仿真轨迹。

11、在一种可能的实现方式中,所述在运行过程中训练并更新所述初始模型,包括:

12、基于所述仿真轨迹与所述场景数据库中的专家轨迹,使用判别模型计算轨迹分布差异,并通过放大所述轨迹分布差异得到差异损失函数,更新所述判别模型;

13、最小化所述轨迹分布差异得到回报损失函数;

14、最大化所述智能体行为分布熵得到行熵损失函数;

15、基于所述回报损失函数以及所述行熵损失函数更新所述决策模型。

16、在一种可能的实现方式中,所述最小化所述轨迹分布差异得到回报损失函数,包括:

17、获取测试过程中的回报信号;

18、基于所述回报信号以及最小化轨迹分布差异得到融合的回报损失函数。

19、在一种可能的实现方式中,所述回报信号包括受试车自动驾驶反馈信号、判别模型给出的差异以及受试车预设各指标的表现。

20、在一种可能的实现方式中,所述单轮决策过程终止条件,包括:

21、受试车发生碰撞事故;和/或

22、受试车完成指定目标的驾驶任务;和/或

23、场景运行超过最大时间/步数限制。

24、在一种可能的实现方式中,所述智能体行为训练终止条件包括:

25、判别模型无法区分仿真坏境中智能体行为分布和真实数据分布;和/或

26、受试车在仿真场景中的测试成功率收敛或低于某个阈值;和/或

27、整个训练持续超过最大轮数限制。

28、在一种可能的实现方式中,所述统计指标至少包括受试车的测试成功率。

29、在一种可能的实现方式中,所述基于所述统计指标更新所述场景数据库,包括:

30、将受试车失误率高于预设的第一阈值,智能体行为分布和真实数据分布低于预设的第二阈值的场景更新到场景数据库;

31、在更新的场景库中标记场景与受试车模型之间的关联,并输出受试车在所述场景库数据库中统计指标。

32、本发明的第二方面,提供一种交通场景生成装置,包括:

33、场景数据库,用于获取仿真场景及初始模型,所述初始模型包括决策模型和判别模型;

34、仿真模块,至少用于运行所述仿真场景直至达到预设的单轮决策过程终止条件,在运行过程中训练并更新所述初始模型,以及用于重复多轮运行所述仿真场景直至达到预设的智能体行为训练终止条件,并记录受试车表现的统计指标;

35、更新模块,至少用于基于所述统计指标更新所述场景数据库。

36、在一种可能的实现方式中,所述仿真模块包括:

37、决策模型,至少用于生成所述仿真场景中的智能体行为;

38、仿真引擎,至少用于基于待测试自动驾驶算法生成所述仿真场景中的受试车行为;

39、以及判别模型,至少用于基于所述仿真轨迹与所述场景数据库中的专家轨迹,计算轨迹分布差异。

40、本发明的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被计算机运行时,执行如本发明实施例的第一方面所述的方法。

41、本发明可应用于自动驾驶的仿真测试以及仿真训练中,通过交通场景智能体训练的方法,能够更准确、更快速地生成符合仿真测试要求的有价值的动态交通场景。同时,本方法生成的动态交通场景应用于仿真训练中,有助于提升受试车所用智能算法的训练效率。

技术特征:

1.一种交通场景生成方法,其特征在于,包括:

2.根据权利要求1所述的交通场景生成方法,其特征在于,所述运行所述仿真场景包括:

3.根据权利要求2所述的交通场景生成方法,其特征在于,所述在运行过程中训练并更新所述初始模型,包括:

4.根据权利要求3所述的交通场景生成方法,其特征在于,所述最小化所述轨迹分布差异得到回报损失函数,包括:

5.根据权利要求4所述的交通场景生成方法,其特征在于,所述回报信号包括受试车自动驾驶反馈信号、判别模型给出的差异以及受试车预设各指标的表现。

6.根据权利要求2或3所述的交通场景生成方法,其特征在于,所述单轮决策过程终止条件,包括:

7.根据权利要求1所述的一种交通场景生成方法,其特征在于,所述智能体行为训练终止条件包括:

8.根据权利要求1所述的一种交通场景生成方法,其特征在于,所述统计指标至少包括受试车的测试成功率。

9.根据权利要求8所述的一种交通场景生成方法,其特征在于,所述基于所述统计指标更新所述场景数据库,包括:

10.一种交通场景生成装置,其特征在于,包括:

11.根据权利要求10所述的一种交通场景生成装置,其特征在于,所述仿真模块包括:

12.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被计算机运行时,执行如权利要求1至9中任一项所述的一种交通场景生成方法。

技术总结本发明公开了一种交通场景生成方法、装置及介质,其方法包括:基于场景数据库获取仿真场景及初始模型,所述初始模型包括决策模型和判别模型;运行所述仿真场景直至达到预设的单轮决策过程终止条件,在运行过程中训练并更新所述初始模型;重复多轮运行所述仿真场景直至达到预设的智能体行为训练终止条件,并记录受试车表现的统计指标;基于所述统计指标更新所述场景数据库。本发明可以使得生成的场景不偏离真实场景分布的同时更广泛地覆盖交通场景的标志性情况,并更快地发现受测的智驾算法可能存在的漏洞。技术研发人员:王汉超,张松,张睿受保护的技术使用者:零束科技有限公司技术研发日:技术公布日:2024/9/29

本文地址:https://www.jishuxx.com/zhuanli/20241009/308133.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。