面向自动驾驶决策算法的安全关键场景生成系统和方法
- 国知局
- 2024-10-09 15:09:33
本发明涉及场景生成,更具体地,涉及一种面向自动驾驶决策算法的安全关键场景生成系统和方法。
背景技术:
1、近年来,随着人工智能技术、计算机技术以及汽车电子电气技术的不断发展,自动驾驶汽车产业得到了飞速发展,已经展现了其在改变现有出行方式、减少交通事故等方面的巨大潜力。高性能的自动驾驶算法可以实现环境感知、自主决策、路径规划等功能,将驾驶员从复杂繁琐的驾驶任务中解脱出来,有效降低因驾驶员不规范驾驶,如疲劳驾驶等引发事故的发生率。然而,由于现实世界长尾分布的特点,在实际的开放和不确定的道路场景下,交通环境十分复杂,自动驾驶汽车的安全性无法完全保证,这限制了其进一步的部署和应用。因此,对自动驾驶算法高效合理的安全评估非常重要,而现实世界的安全测试耗费时间过长且成本高昂,在模拟环境中进行安全关键场景验证成为解决这个问题的可行办法。
2、安全关键场景是指自动驾驶汽车极有可能会与其他实体发生碰撞的场景。在该类场景下,预留给自动驾驶汽车的反应时间非常短,需要自动驾驶汽车快速检测到潜在危险并做出相应措施来避免事故发生。对自动驾驶算法安全性威胁强的安全关键场景通常是罕见、复杂、未知的,现有已知、简单、确定的模拟环境测试得出的场景缺乏多样性和复杂性。
3、综上,安全关键场景的生成效率对于自动驾驶算法的安全性评价至关重要。而现有研究主要针对构成安全关键场景的动态参数或静态参数中的一类进行优化,这限制了安全关键场景生成效率的提升。
技术实现思路
1、本发明的目的是克服上述现有技术的缺陷,提供一种面向自动驾驶决策算法的安全关键场景生成系统和方法。
2、根据本发明的第一方面,提供一种面向自动驾驶决策算法的安全关键场景生成系统,该系统以最大化自动驾驶车所面临的风险为目标,获取安全关键场景,该系统包括交通参与者模块、动态参数优化模块、静态参数优化模块和数据库模块,其中:
3、交通参与者模块利用基于知识的交通先验模型和策略网络的潜在输出,以最大化自动驾驶车行驶面临风险为目标,优化对抗背景车的驾驶策略,以得到对应的可执行驾驶动作;
4、静态参数优化模块用于构建初始状态空间,并在交替进行静态参数优化和动态参数优化过程中,更新状态空间;
5、动态参数优化模块通过对当前的状态空间进行循环,以最大化设定的奖励函数为优化目标,更新对抗车对应的策略网络参数;
6、数据库模块用于储存生成的安全关键场景参数轨迹。
7、根据本发明的第二方面,提供一种安全关键场景生成方法,包括以下步骤:
8、利用所提供的系统,得到安全关键场景;
9、基于所述安全关键场景验证目标自动驾驶算法的安全性。
10、与现有技术相比,本发明的优点在于,针对任意自动驾驶决策算法,提出一种结合动态和静态场景参数的安全关键场景生成框架,该框架在引入交通知识和规则的基础上,交替优化场景初始状态和参数轨迹生成,加速生成真实性强且复杂多样的安全关键场景,从而有效提升了自动驾驶决策算法安全测试的准确性和效率。
11、通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
技术特征:1.一种面向自动驾驶决策算法的安全关键场景生成系统,该系统以最大化自动驾驶车所面临的风险为目标,获取安全关键场景,该系统包括交通参与者模块、动态参数优化模块、静态参数优化模块和数据库模块,其中:
2.根据权利要求1所述的系统,其特征在于,所述最大化自动驾驶车所面临的风险表示为:
3.根据权利要求1所述的系统,其特征在于,所述交通先验模型根据以下方程建立:
4.根据权利要求1所述的系统,其特征在于,所述奖励函数表示为:
5.根据权利要求1所述的系统,其特征在于,所述数据库模块包括轨迹数据库和安全场景库,所述轨迹数据库包含安全轨迹数据库和安全关键轨迹数据库,其中针对生成的行驶轨迹,如果所有车辆间未发生碰撞,则存入所述安全轨迹数据库;如果自动驾驶车av和背景车发生碰撞且背景车之间未碰撞,则将对应行驶轨迹存入所述安全关键轨迹数据库,并将碰撞场景存入所述安全关键场景库。
6.根据权利要求5所述的系统,其特征在于,所述初始状态空间根据以下步骤获得:
7.根据权利要求1所述的系统,其特征在于,所述策略网络是sac-actor网络。
8.一种安全关键场景生成方法,包括以下步骤:
9.一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现根据权利要求8所述的方法的步骤。
10.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求8所述的方法的步骤。
技术总结本发明公开一种面向自动驾驶决策算法的安全关键场景生成系统和方法。该系统以最大化自动驾驶车所面临的风险为目标,获取安全关键场景,其中交通参与者模块利用基于知识的交通先验模型和策略网络的潜在输出,以最大化自动驾驶车行驶面临风险为目标,优化对抗背景车的驾驶策略,以得到对应的可执行驾驶动作;静态参数优化模块用于构建初始状态空间,并在交替进行静态参数优化和动态参数优化过程中,更新状态空间;动态参数优化模块通过对当前的状态空间进行循环,以最大化设定的奖励函数为优化目标,更新对抗车对应的策略网络参数;数据库模块用于储存生成的安全关键场景参数轨迹。本发明能够有效提升了自动驾驶决策算法安全测试的准确性和效率。技术研发人员:黄岩军,王兆一,杜嘉彤,陈昊天,聂佳磊,李欣城受保护的技术使用者:同济大学技术研发日:技术公布日:2024/9/29本文地址:https://www.jishuxx.com/zhuanli/20241009/307867.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表