一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

自动驾驶汽车的集成式决控方法、装置及存储介质与流程

2021-11-10 03:03:00 来源:中国专利 TAG:

技术特征:
1.一种自动驾驶汽车的集成式决控方法,其特征在于,包括:根据交通驾驶场景的静态信息构造候选路径集合,对所述候选路径集合中每一条候选路径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优决控策略和最优评价函数;从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。2.根据权利要求1所述的集成式决控方法,其特征在于,所述交通驾驶场景的静态信息包括道路结构、限速、路面标识和交通法规;所述交通驾驶场景的动态信息包括自动驾驶汽车动力学、周围交通参与者和交通信号灯信息。3.根据权利要求1所述的集成式决控方法,其特征在于,所述候选路径集合为π,其表达式为:其中,τ
i
为对将可通行车道l
i
的车道中心线作为的候选路径经过离散化后得到的离散候选路径,i∈{1,n
lane
},n
lane
为自动驾驶汽车可通行的车道数量;为对候离散选路径τ
i
设定的期望速度。4.根据权利要求3所述的集成式决控方法,其特征在于,所述路径跟踪模型为:x
ego,k 1
=f
ego
(x
ego,k
,u
k
)
ꢀꢀꢀꢀ
(3)x
surr,k 1
=f
surr
(x
ego,k
,x
surr,k
)
ꢀꢀꢀꢀ
(4)x
road,k
=f
road
(x
ego,k
)
ꢀꢀꢀꢀ
(5)h(x
ego,k
,x
surr,k
)≥d
safe
ꢀꢀꢀꢀ
(6)h(x
ego,k
,x
road,k
)≥d
safe
ꢀꢀꢀꢀ
(7)其中:式(2)为第i条离散候选路径τ
i
对应的路径跟踪模型的目标函数;为第i条离散候选路径τ
i
对应的路径跟踪模型的最优目标函数;j
i
为第i条离散候选路径τ
i
对应的路径跟踪模型的目标函数;n
p
为预测总步数,取值范围为[1,∞);k∈{0,...,n
p

1};为第i条离散候选路径τ
i
的状态,即x
ego,k
为第k步的自动驾驶汽车状态,其中包括自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度;x
surr,k
为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行人;x
road,k
为第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车道限速;u
k
为第k步的自动驾驶汽车决控参数,包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的期望轨迹;l为效用函数,包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量损耗,用于计算每一时间步下的代价;
式(3)为自动驾驶汽车的动力学模型;f
ego
(
·
)为第一非线性映射,反映了自动驾驶汽车从第k步状态到k 1步状态的转移关系;式(4)为周围交通参与者的运动学模型;f
surr
(
·
)为第二非线性映射,反映了周围交通参与者从第k步状态到第k 1步状态的转移关系;式(5)为道路与环境模型;f
road
(
·
)为第三非线性映射,反映了第k步道路与环境信息与第k步自动驾驶汽车状态的关联;式(6)为自动驾驶汽车与周围交通参与者的安全约束;h(
·
)为第四非线性映射;d
safe
为设定的自动驾驶汽车与周围交通参与者间的安全距离;式(7)为自动驾驶汽车与道路的安全约束。5.根据权利要求4所述的集成式决控方法,其特征在于,设定所述路径优选模型的目标函数为:6.根据权利要求5所述的集成式决控方法,其特征在于,所述决控策略求解模型为:x
ego,k 1
=f
ego
(x
ego,k
,u
k
)
ꢀꢀꢀꢀꢀ
(10)x
surr,k 1
=f
surr
(x
ego,k
,x
surr,k
)
ꢀꢀꢀꢀ
(11)x
road,k
=f
road
(x
ego,k
)
ꢀꢀꢀꢀ
(12)u
k
=π
θ
(s
k
)
ꢀꢀꢀꢀꢀ
(13)h(x
ego,k
,x
surr,k
)≥d
safe
ꢀꢀꢀꢀ
(14)h(x
ego,k
,x
road,k
)≥d
safe
ꢀꢀꢀꢀ
(15)其中:式(9)为所述求解决控策略模型的目标函数;θ为策略参数;表示初始状态s0分布下的期望性能,所述初始状态分布为不同离散候选路径、自动驾驶汽车状态、周围交通参与者状态和道路状态的联合分布;u
k
为自动驾驶汽车决控参数;s
k
为第k步的自动驾驶汽车决控策略状态的输入,式(10)、(11)和(12)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型和道路与环境模型;式(13)为使用决控策略π
θ
(
·
)得到的自动驾驶汽车决控参数u
k
;决控策略π
θ
(
·
)为使用策略参数θ参数化的第五非线性映射,反映了第k步的自动驾驶汽车决控参数u
k
与自动驾驶汽车状态x
ego,k
的关联;式(14)和(15)分别为自动驾驶汽车与周围交通参与者的安全约束和自动驾驶汽车与道路的安全约束。7.根据权利要求6所述的集成式决控方法,其特征在于,所述评价函数求解模型为:x
ego,k 1
=f
ego
(x
ego,k
,u
k
)
ꢀꢀꢀꢀ
(17)
x
surr,k 1
=f
surr
(x
ego,k
,x
surr,k
)
ꢀꢀꢀꢀ
(18)x
road,k
=f
road
(x
ego,k
)
ꢀꢀꢀꢀꢀꢀꢀ
(19)u
k
=π
θ
(s
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)其中:式(16)为所述评价函数求解模型的目标函数,w为评价函数v
w
(
·
)参数,评价函数v
w
(
·
)为使用w参数化的第六非线性映射,反映了从当前状态到目标函数的关联;式(17)、(18)、(19)和(20)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型、道路与环境模型和使用决控策略π
θ
(
·
)得到自动驾驶汽车决控参数u
k
。8.根据权利要求7所述的集成式决控方法,其特征在于,通过下式选择所述最优路径:其中,i
opt
为所述最优路径;为所述最优评价函数;s
i
为离散候选路径对应的状态向量,通过下式确定所述最优动作:其中,u为所述最优动作;为所述最优决控策略;为最优路径i
opt
对应的状态向量,向量,为最优路径的状态。9.一种自动驾驶汽车的集成式决控装置,其特征在于,包括:模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对所述候选路径集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;离线求解模块,用于将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优决控策略和最优评价函数;和在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1

8中任一项所述的自动驾驶汽车的集成式决控方法。

技术总结
本公开提供的自动驾驶汽车的集成式决控方法、装置及存储介质,本公开包括:根据交通驾驶场景的静态信息构造候选路径集合,对候选路径集合中每一条候选路径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;将路径跟踪模型和路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最优决控策略和最优评价函数;从自动驾驶汽车出发时刻开始,每一时刻利用最优评价函数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。本公开的可扩展性强且在线计算效率高。线计算效率高。线计算效率高。


技术研发人员:李升波 关阳 任彦刚 余冬杰 成波 陈建宇
受保护的技术使用者:清华大学
技术研发日:2021.08.26
技术公布日:2021/11/9
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献