车辆四轮定位参数的预调整方法、装置、车辆及存储介质与流程
- 国知局
- 2024-08-22 14:59:14
本技术涉及车辆控制,特别涉及一种车辆四轮定位参数的预调整方法、装置、车辆及存储介质。
背景技术:
1、车辆四轮定位参数是重要的系统参数,对车辆性能有重要意义。车辆下线后,要在检测线进行四轮定位参数的检测、调整,确保全部合格才能流转。整车装配完成后,由于空间的限制,在检测线进行四轮定位的调整操作不方便,影响生产节拍,一般都会在底盘分装线进行四轮定位参数的预调整,以提高检测线上线的四轮定位一次合格率,尽量减少检测线调整频率,提高生产效率。
2、相关技术中,能够通过自动调节单元模拟人工手动调节螺栓、螺母的旋转,当前束和外倾调整到合格范围时,停止旋转螺栓,并按照规定力矩锁紧固定螺母,完成后悬前束、外倾调节。
3、然而,相关技术在对四轮定位参数调整时,需要花费大量时间,且难以快速准确的将四轮定位参数调整到设定数值,效率难以提升,准确性较低,亟待改善。
技术实现思路
1、本技术提供一种车辆四轮定位参数的预调整方法、装置、车辆及存储介质,以解决相关技术在对四轮定位参数调整时,需要花费大量时间,且难以快速准确的将四轮定位参数调整到设定数值,效率难以提升,准确性较低等问题。
2、本技术第一方面实施例提供一种车辆四轮定位参数的预调整方法,包括以下步骤:在检测到车辆进入预调整模式的情况下,获取所述车辆的四轮定位参数的合格范围;基于所述合格范围和初始值,利用预设价值函数获取所述车辆的任一调整动作的奖励值;根据所述奖励值和预设强化学习算法确定所述车辆的新的调整动作,作为所述任一调整动作,以获取所述新的调整动作的奖励值,直至所述奖励值满足预设停止条件,使得所述四轮定位参数进入所述合格范围。
3、根据上述技术手段,本技术实施例可以根据奖励值和预设强化学习算法确定车辆的新的调整动作,作为任一调整动作,以获取新的调整动作的奖励值,从而保证本技术可以基于强化学习算法进行悬架总成四轮定位的自动预调整,效率得到极大提升,准确性更高。
4、可选地,在本技术的一个实施例中,在直至所述奖励值满足所述预设学习停止条件之前,还包括:统计所述奖励值的学习次数;在所述学习次数大于预设阈值且不满足所述预设学习停止条件的情况下,控制所述车辆退出所述预调整模式,提示用户进行手动调整。
5、根据上述技术手段,本技术实施例可以控制车辆退出预调整模式,提示用户进行手动调整,保证了调整的智能性,提升了调整的效率。
6、可选地,在本技术的一个实施例中,在根据所述奖励值和所述预设强化学习算法确定所述车辆的新的调整动作之前,还包括:在算法训练阶段,对强化学习算法进行自学习,直至所述强化学习算法的调节精度和效率满足预设条件,得到所述预设强化学习算法。
7、根据上述技术手段,本技术实施例可以对强化学习算法进行自学习,直至强化学习算法的调节精度和效率满足预设条件,得到预设强化学习算法,保证本技术比人为制定调整规则和寻优算法有明显优势,能自动适应各种结构类型的悬架。
8、可选地,在本技术的一个实施例中,所述预设价值函数为:
9、q(s,a)=q(s,a)+α[r+γmaxq(s′,a′)-q(s,a)],
10、其中,q(s,a)表示在状态s下采取行动a的价值,α为学习率,r表示在所述状态s采取所述行动a后获得的奖励,γ为折扣因子,maxq(s′,a′)表示在下一个状态s′下所有可能的行动a′中选择最大的q值。
11、根据上述技术手段,本技术实施例根据公式,提高了预设价值函数计算的精准度,从而保证四轮定位参数的预调整效率和准确性更高。
12、可选地,在本技术的一个实施例中,所述预设停止条件包括所述四轮定位参数中的偏差均值和标准差小于或等于第一预设阈值,且所述四轮定位参数中的过程能力指数大于或等于第二预设阈值。
13、根据上述技术手段,本技术实施例可以在四轮定位参数中的偏差均值和标准差小于或等于第一预设阈值,且四轮定位参数中的过程能力指数大于或等于第二预设阈值时,确定满足预设停止条件,为控制车辆退出预调整模式提供支撑。
14、本技术第二方面实施例提供一种车辆四轮定位参数的预调整装置,包括:第一获取模块,用于在检测到车辆进入预调整模式的情况下,获取所述车辆的四轮定位参数的合格范围;第二获取模块,用于基于所述合格范围和初始值,利用预设价值函数获取所述车辆的任一调整动作的奖励值;预调整模块,用于根据所述奖励值和预设强化学习算法确定所述车辆的新的调整动作,作为所述任一调整动作,以获取所述新的调整动作的奖励值,直至所述奖励值满足预设停止条件,使得所述四轮定位参数进入所述合格范围。
15、可选地,在本技术的一个实施例中,还包括:统计模块,用于在直至所述奖励值满足所述预设学习停止条件之前,统计所述奖励值的学习次数;提示模块,用于在所述学习次数大于预设阈值且不满足所述预设学习停止条件的情况下,控制所述车辆退出所述预调整模式,提示用户进行手动调整。
16、可选地,在本技术的一个实施例中,还包括:训练模块,用于在根据所述奖励值和所述预设强化学习算法确定所述车辆的新的调整动作之前,在算法训练阶段,对强化学习算法进行自学习,直至所述强化学习算法的调节精度和效率满足预设条件,得到所述预设强化学习算法。
17、可选地,在本技术的一个实施例中,所述预设价值函数为:
18、q(s,a)=q(s,a)+α[r+γmaxq(s′,a′)-q(s,a)],
19、其中,q(s,a)表示在状态s下采取行动a的价值,α为学习率,r表示在所述状态s采取所述行动a后获得的奖励,γ为折扣因子,maxq(s′,a′)表示在下一个状态s′下所有可能的行动a′中选择最大的q值。
20、可选地,在本技术的一个实施例中,所述预设停止条件包括所述四轮定位参数中的偏差均值和标准差小于或等于第一预设阈值,且所述四轮定位参数中的过程能力指数大于或等于第二预设阈值。
21、本技术第三方面实施例提供一种车辆,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的车辆四轮定位参数的预调整方法。
22、本技术第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的车辆四轮定位参数的预调整方法。
23、本技术实施例的有益效果:
24、(1)本技术实施例可以基于强化学习算法进行悬架总成四轮定位的自动预调整,相对人工(或模拟人工)进行四轮定位参数的反复调整,效率得到极大提升,准确性更高。
25、(2)本技术实施例可以采用强化学习算法进行最优动作的寻找和训练,算法可以针对目标进行自学习,比人为的制定调整规则和寻优算法有明显优势,能自动适应各种结构类型的悬架。同时,对同一种类型悬架的零部件波动,可以自动学习适应,样本越大,算法效果越好,快速准确的将四轮定位参数调整到设定数值。
26、本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
本文地址:https://www.jishuxx.com/zhuanli/20240822/280673.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表