技术新讯 > 船舶设备制造技术 > 基于准则导向视觉监督的智能船舶自变通避碰决策方法  >  正文

基于准则导向视觉监督的智能船舶自变通避碰决策方法

  • 国知局
  • 2024-08-01 06:39:47

本发明涉及视觉监督学习、人工智能、航海等领域,具体涉及一种基于准则导向视觉监督的智能船舶自变通避碰决策方法。

背景技术:

1、随着船舶密度和航线交织的增加,海上交通变得愈发错综复杂。这种复杂性使得海上交通面临着更多的潜在危险会遇场景,突显了船舶避碰决策在保障海上交通安全中的不可忽视的重要性。尤其是在动态和静态障碍物环境相互交织的场景中,船舶的避碰决策显得尤为关键。在当前智能船舶避碰决策问题的研究中,基于规则的方法一直是主流,这些方法通过定义事先设定的国际海上避碰规则来指导船舶的行为。例如,人工势场方法试图通过模拟船舶之间的相互作用力场来实现避,而动态滑动窗口和速度障碍法则通过设定窗口或限制速度来规划船舶的轨迹。这类基于规则的避碰决策算法在单船避让场景中发挥着重要作用。然而,其局限性在于仅能应对特定场景,缺乏对复杂、动态环境的适应性。相较之下,学习类算法,尤其是深度强化学习,具有更强的灵活性和潜在的自适应性,近年来被广泛地应用在船舶避碰决策问题求解当中。这类算法借鉴了类脑型监督学习的思想,通过学习模型从环境中获取知识和经验。然而,不可避免地存在“黑箱”问题,即模型内部的决策机制难以解释和理解,限制了算法的可解释性。

2、不论是基于规则的传统算法还是采用学习类的方法,它们共同面临的主要挑战在于实现良好的自适应性并控制学习成本。船舶可能遭遇各种复杂而多变的危险会遇场景,传统算法所依赖的预定义避碰规则往往难以覆盖所有可能的情况。这使得算法需要具备较高的自适应性,以在不同环境中有效进行避碰决策,同时又需要避免过度学习以及新环境反复训练造成的成本上升。因此,急需一种可以快速训练又能够自变通避碰决策的模型和算法来解决当前的困境。

技术实现思路

1、鉴于现有技术的不足,本发明提供一种基于准则导向视觉监督的智能船舶自变通避碰决策方法。本发明可以在不同复杂程度的会遇场景中展现出自适应避碰决策,无需重新训练,大幅降低了学习成本,提升了性能。同时在训练过程中通过接触各种随机生成的会遇场景,使本方法具备了更强的泛化能力。

2、本发明采用的技术手段如下:

3、一种基于准则导向视觉监督的智能船舶自变通避碰决策方法,包括:

4、构建基于准则导向下智能船舶避碰视觉监督学习的带有标注的合成数据集,所述合成数据集的生成准则导向包括第一生成准则导向、第二生成准则导向和第三生成准则导向,所述第一生成准则导向用于构建船舶与障碍物的位置关系,所述第二生成准则导向用于对图像数据进行随机旋转,所述第三生成准则导向用于定义避碰策略的三个类别;

5、基于所述合成数据集训练深层次卷积模型,所述深层次卷积模型包括深层次特征提取层和全连接输出层,所述深层次特征提取层用于获取船舶实时运动图像的图像特征,所述全连接输出层用于将图像特征映射到避碰策略的三个类别中,所述避碰策略的三个类别分别表示左转、右转和直行,通过标签0、1和2代表,;

6、获取船舶实时运动图像,将所述船舶实时运动图像输入训练后的深层次卷积模型,通过所述深层次卷积模型进行智能船舶自变通避碰决策。

7、进一步地,通过所述深层次卷积模型进行智能船舶自变通避碰决策之前,还包括:

8、构建智能船舶自变通避碰决策模型,所述智能船舶自变通避碰决策模型分别采用随机定义或者人为定义的方式确定合成数据集中的动态船舶的起点和终点,通过所述构建智能船舶自变通避碰决策模型对训练后的深层次卷积模型进行多场景泛化能力测试,以实现智能船舶对不同会遇场景的自适应、自变通避碰决策。

9、进一步地,所述第一生成准则导向包括:

10、随机选取动态船舶图像iship、旋转角度θship以及船舶位置pship(dx,dy),所述旋转角度θship被定义为模拟船舶的航向,其中,船舶位置pship(dx,dy)的计算为公式1所示:

11、

12、其中,dx表示坐标横轴,dy表示坐标纵轴,osize表示图像的观察大小,

13、随机选取静态障碍物图像istate和旋转角度θstate,θstate=θ:u(0°,360°),基于公式2和公式3随机生成静态障碍物与船舶间的距离dship_state和相对角度θship_state:

14、dship_state=d:u(lship,osize/2)                     (2)

15、θship_state=θ:u(-180°,180°)                     (3)

16、其中,u(lship,osize/2)表示在区间[lship,osize/2]上均匀分布的随机变量,lship代表船舶的长度,u(-180°,180°)表示在区间[-180°,180°]上均匀分布的随机变量,静态障碍物的位置pstate(dx,dy)计算可以通过公式4来获取。

17、

18、在图像上随机生成第i个船舶,并随机生成旋转角度θship=θ:u(0°,360°),则船舶间的距离dship_ship和相对角度θship_ship根据公式5和公式6随机生成:

19、dship_ship=d:u(lship,osize/2)                     (5)

20、θship_ship=θ:u(-180°,180°)                     (6)

21、那么,第i个船舶的位置计算可以通过公式7来获取:

22、

23、进一步地,所述第三生成准则导向包括:

24、定义3种类型的标签,分别为0标签表示右转、1标签表示左转、2标签表示直行;

25、将智能船舶初始化在图像中间位置,并初始化随机的旋转角度θship_agent;

26、将其他船舶与静态障碍物生成的概率定义为50%,是否需要避让的生成概率同样定义为50%;

27、将不需要避让的条件定义为障碍物位于智能船舶后方时不需要避让;

28、将在需要避让的条件定义为障碍物在智能体前方时,智能体进行左转避让,否则右转避让,标签定义如公式8所示:

29、

30、在不需要避让的情况下,如果航向角度在-30到30之间,表示智能船舶正朝着目标方向前进,标签定义如公式9所示:

31、

32、进一步地,所述深层次卷积模型为具有18层的深度神经网络模型,其中特征提取层由17个卷积层组成。

33、较现有技术相比,本发明具有以下优点:

34、1、本发明通过生成准则引导视觉监督学习,通过制定明确的准则,引导视觉监督数据集的生成,利用视觉监督学习来泛化生成多样性的会遇场景数据。此方法解决了深度强化学习中数据获取难且有限的问题,为提高模型性能提供了更具普适性的数据来源。

35、2、本发明提供了基于准则导向下视觉监督学习的自变通避碰决策,将规则引导视觉监督学习的方法应用于具有会遇场景泛化能力的自变通避碰决策环境,验证了该方法在不同复杂程度的会遇场景中自适应避碰决策。此方法无需重新训练,显著降低了学习成本,提升了性能。

本文地址:https://www.jishuxx.com/zhuanli/20240722/224690.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。