一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

车辆控制装置、车辆控制方法及存储介质与流程

2021-10-23 01:31:00 来源:中国专利 TAG:车辆 控制 日本国 援用 装置

车辆控制装置、车辆控制方法及存储介质
1.本技术基于2020年3月31日申请的日本国专利申请第2020

063096号来主张优先权,并将其内容援用于此。
技术领域
2.本发明涉及车辆控制装置、车辆控制方法及存储介质。


背景技术:

3.已知一种生成车辆将来应该行驶的目标轨道的技术(例如,参照日本国特开2019

108124号)。


技术实现要素:

4.然而,在以往的技术中,有时生成与周边的状况不适合的目标轨道。其结果是,有时不能顺畅地控制车辆的驾驶。
5.本发明的一方案提供一种能够顺畅地控制车辆的驾驶的车辆控制装置、车辆控制方法及存储介质。
6.本发明的车辆控制装置、车辆控制方法及存储介质采用了以下的结构。
7.本发明的第一方案是一种车辆控制装置,其中,所述车辆控制装置具备:识别部,其识别存在于车辆的周边的物体;算出部,其算出在由所述识别部识别出的所述物体的周围分布的风险的区域;生成部,其对当输入所述区域时输出所述车辆应该行驶的目标轨道的多个模型分别输入由所述算出部算出的所述区域,并基于输入了所述区域的所述多个模型各自的输出结果,来生成多个所述目标轨道;以及驾驶控制部,其基于由所述生成部生成的所述目标轨道,来自动地控制所述车辆的驾驶,所述多个模型包括第一模型和第二模型,所述第一模型是根据所述区域而输出所述目标轨道的基于规则或基于模型的模型,所述第二模型是以当输入所述区域时输出所述目标轨道的方式进行了学习的基于机器学习的模型,在基于由所述第一模型输出的所述目标轨道即第一目标轨道来控制所述车辆的驾驶的第一条件下会出现在所述车辆的速度成为规定值以下之后所述车辆加速这一情况、且在基于由所述第二模型输出的所述目标轨道即第二目标轨道来控制所述车辆的驾驶的第二条件下会出现在所述车辆的速度成为规定值以下之后所述车辆加速这一情况时,所述生成部选择所述第一目标轨道及所述第二目标轨道中的所述第二目标轨道。
8.第二方案是在第一方案的基础上,所述识别部还预测识别到的物体的将来的轨道,所述生成部在由所述识别部预测的所述物体的将来的轨道与所述车辆的目标轨道交叉的情况下,判定为在所述第一条件下会出现在所述车辆的速度成为所述规定值以下之后所述车辆加速这一情况、且在所述第二条件下会出现在所述车辆的速度成为所述规定值以下之后所述车辆加速这一情况。
9.第三方案是在第一或第二方案的基础上,所述规定值为零,所述生成部在所述第一条件下会出现在所述车辆的速度停止之后所述车辆的加速度处于规定范围内这一情况、
且在所述第二条件下会出现在所述车辆的速度停止之后所述车辆的加速度处于规定范围内这一情况时,选择所述第一目标轨道及所述第二目标轨道中的所述第二目标轨道。
10.第四方案是一种车辆控制方法,其中,所述车辆控制方法使搭载于车辆的计算机执行如下处理:识别存在于所述车辆的周边的物体;算出在所述识别的物体的周围分布的风险的区域;对当输入所述区域时输出所述车辆应该行驶的目标轨道的多个模型分别输入所述算出的区域,并基于输入了所述区域的所述多个模型各自的输出结果,来生成多个所述目标轨道;基于所述生成的目标轨道,来自动地控制所述车辆的驾驶;以及所述多个模型包括第一模型和第二模型,所述第一模型是根据所述区域而输出所述目标轨道的基于规则或基于模型的模型,所述第二模型是以当输入所述区域时输出所述目标轨道的方式进行了学习的基于机器学习的模型,在基于由所述第一模型输出的所述目标轨道即第一目标轨道来控制所述车辆的驾驶的第一条件下会出现在所述车辆的速度成为规定值以下之后所述车辆加速这一情况、且在基于由所述第二模型输出的所述目标轨道即第二目标轨道来控制所述车辆的驾驶的第二条件下会出现在所述车辆的速度成为规定值以下之后所述车辆加速这一情况时,选择所述第一目标轨道及所述第二目标轨道中的所述第二目标轨道。
11.第五方案是一种存储介质,其是存储有程序的能够由计算机读取的存储介质,其中,所述程序用于使搭载于车辆的计算机执行如下处理:识别存在于所述车辆的周边的物体;算出在所述识别的物体的周围分布的风险的区域;对当输入所述区域时输出所述车辆应该行驶的目标轨道的多个模型分别输入所述算出的区域,并基于输入了所述区域的所述多个模型各自的输出结果,来生成多个所述目标轨道;基于所述生成的目标轨道来自动地控制所述车辆的驾驶;以及所述多个模型包括第一模型和第二模型,所述第一模型是根据所述区域而输出所述目标轨道的基于规则或基于模型的模型,所述第二模型是以当输入所述区域时输出所述目标轨道的方式进行了学习的基于机器学习的模型,在基于由所述第一模型输出的所述目标轨道即第一目标轨道来控制所述车辆的驾驶的第一条件下会出现在所述车辆的速度成为规定值以下之后所述车辆加速这一情况、且在基于由所述第二模型输出的所述目标轨道即第二目标轨道来控制所述车辆的驾驶的第二条件下会出现在所述车辆的速度成为规定值以下之后所述车辆加速这一情况时,选择所述第一目标轨道及所述第二目标轨道中的所述第二目标轨道。
12.根据上述的任一方案,能够通过生成与周边的状况适合的目标轨道来顺畅地控制车辆的驾驶。
附图说明
13.图1是利用了实施方式的车辆控制装置的车辆系统的结构图。
14.图2是实施方式的第一控制部、第二控制部及存储部的功能结构图。
15.图3是用于说明风险区域的图。
16.图4是表示某坐标x1处的y方向上的潜在风险值的变化的图。
17.图5是表示某坐标x2处的y方向上的潜在风险值的变化的图。
18.图6是表示某坐标x3处的y方向上的潜在风险值的变化的图。
19.图7是表示某坐标y4处的x方向上的潜在风险值的变化的图。
20.图8是表示决定了潜在风险值的风险区域的图。
21.图9是示意性地表示目标轨道的生成方法的图。
22.图10是表示模型输出的目标轨道的一例的图。
23.图11是表示由实施方式的自动驾驶控制装置进行的一系列处理的流程的一例的流程图。
24.图12是表示本车辆可能遭遇的场景的一例的图。
25.图13是表示基于目标轨道来控制本车辆的驾驶的场景的一例的图。
26.图14是表示实施方式的自动驾驶控制装置的硬件结构的一例的图。
具体实施方式
27.以下,参照附图来说明本发明的车辆控制装置、车辆控制方法及程序的实施方式。实施方式的车辆控制装置例如适用于自动驾驶车辆。自动驾驶例如是指控制车辆的速度及转向中的一方或双方来控制车辆的驾驶。在上述的车辆的驾驶控制中,例如包括acc(adaptive cruise control system)、tjp(traffic jam pilot)、alc(auto lane changing)、cmbs(collision mitigation brake system)、lkas(lane keeping assistance system)这样的各种的驾驶控制。自动驾驶车辆也可以通过乘员(驾驶员)的手动驾驶来控制驾驶。
28.[整体结构]
[0029]
图1是利用了实施方式的车辆控制装置的车辆系统1的结构图。搭载车辆系统1的车辆(以下称作本车辆m)例如是二轮、三轮、四轮等的车辆,其驱动源是柴油发动机、汽油发动机等内燃机、电动机、或者它们的组合。电动机使用由与内燃机连结的发电机发出的发电电力、或者二次电池、燃料电池的放电电力来进行动作。
[0030]
车辆系统1例如具备相机10、雷达装置12、lidar(light detection and ranging)14、物体识别装置16、通信装置20、hmi(human machine interface)30、车辆传感器40、导航装置50、mpu(map positioning unit)60、驾驶操作件80、自动驾驶控制装置100、行驶驱动力输出装置200、制动装置210及转向装置220。这些装置、设备通过can(controller area network)通信线等多路通信线、串行通信线、无线通信网等互相连接。图1所示的结构只不过是一例,既可以省略结构的一部分,也可以还追加别的结构。自动驾驶控制装置100是“车辆控制装置”的一例。
[0031]
相机10例如是利用了ccd(charge coupled device)、cmos(complementary metal oxide semiconductor)等固体摄像元件的数码相机。相机10安装于本车辆m的任意部位。例如,在对本车辆m的前方进行拍摄的情况下,相机10安装于前风窗玻璃上部、车室内后视镜背面等。另外,在对本车辆m的后方进行拍摄的情况下,相机10安装于后风窗玻璃上部等。另外,在对本车辆m的右侧方或左侧方进行拍摄的情况下,相机10安装于车身、车门上后视镜的右侧面或左侧面等。相机10例如周期性地反复对本车辆m的周边进行拍摄。相机10也可以是立体相机。
[0032]
雷达装置12向本车辆m的周边放射毫米波等电波,并且检测由物体反射的电波(反射波)来至少检测物体的位置(距离及方位)。雷达装置12安装于本车辆m的任意部位。雷达装置12也可以通过fm

cw(frequency modulated continuous wave)方式来检测物体的位置及速度。
[0033]
lidar14向本车辆m的周边照射光,并测定该照射的光的散射光。lidar14基于从发光到受光的时间,来检测到对象为止的距离。照射的光例如可以是脉冲状的激光。lidar14安装于本车辆m的任意部位。
[0034]
物体识别装置16对由相机10、雷达装置12及lidar14中的一部分或全部检测的检测结果进行传感器融合处理,来识别物体的位置、种类、速度等。物体识别装置16将识别结果向自动驾驶控制装置100输出。另外,物体识别装置16可以将相机10、雷达装置12及lidar14的检测结果直接向自动驾驶控制装置100输出。在该情况下,也可以从车辆系统1中省略物体识别装置16。
[0035]
通信装置20例如利用蜂窝网、wi

fi网、bluetooth(注册商标)、dsrc(dedicated short range communication)等与存在于本车辆m的周边的其他车辆通信、或者经由无线基站与各种服务器装置通信。
[0036]
hmi30对本车辆m的乘员(包括驾驶员)提示各种信息,并且接受由乘员进行的输入操作。hmi30例如可以具备显示器、扬声器、蜂鸣器、触摸面板、麦克风、开关、按键等。
[0037]
车辆传感器40包括检测本车辆m的速度的车速传感器、检测加速度的加速度传感器、检测绕铅垂轴的角速度的横摆角速度传感器、检测本车辆m的朝向的方位传感器等。
[0038]
导航装置50例如具备gnss(global navigation satellite system)接收机51、导航hmi52及路径决定部53。导航装置50在hdd(hard disk drive)、闪存器等存储装置中保持有第一地图信息54。
[0039]
gnss接收机51基于从gnss卫星接收的信号来确定本车辆m的位置。本车辆m的位置也可以通过利用了车辆传感器40的输出的ins(inertial navigation system)来确定或补充。
[0040]
导航hmi52包括显示装置、扬声器、触摸面板、按键等。导航hmi52也可以一部分或全部与前述的hmi30共用化。例如,乘员也可以代替对hmi30输入本车辆m的目的地,或者除此之外还对导航hmi52输入本车辆m的目的地。
[0041]
路径决定部53例如参照第一地图信息54来决定从由gnss接收机51确定的本车辆m的位置(或者输入的任意的位置)到由乘员使用hm30、导航hmi52输入的目的地的路径(以下称作地图上路径)。
[0042]
第一地图信息54例如是通过表示道路的路段和由路段连接的节点来表现道路形状的信息。第一地图信息54也可以包括道路的曲率、poi(point ofinterest)信息等。地图上路径向mpu60输出。
[0043]
导航装置50也可以基于地图上路径来进行使用了导航hmi52的路径引导。导航装置50例如也可以由乘员持有的智能手机、平板终端等终端装置的功能来实现。导航装置50也可以经由通信装置20向导航服务器发送当前位置和目的地,并从导航服务器取得与地图上路径同等的路径。
[0044]
mpu60例如包括推荐车道决定部61,并在hdd、闪存器等存储装置中保持有第二地图信息62。推荐车道决定部61将从导航装置50提供的地图上路径分割为多个区块(例如,在车辆行进方向上按每100[m]进行分割),并参照第二地图信息62按每个区块来决定推荐车道。推荐车道决定部61进行在从左数第几车道上行驶这一决定。推荐车道决定部61在地图上路径存在分支部位的情况下,以使本车辆m能够在用于向分支目的地行进的合理的路径
上行驶的方式决定推荐车道。
[0045]
第二地图信息62是比第一地图信息54高精度的地图信息。第二地图信息62例如包括车道的中央的信息或者车道的边界的信息等。另外,在第二地图信息62中,可以包括道路信息、交通限制信息、住所信息(住所、邮政编码)、设施信息、电话号码信息等。第二地图信息62可以通过通信装置20与其他装置通信而随时被更新。
[0046]
驾驶操作件80例如包括油门踏板、制动踏板、换挡杆、转向盘、异形方向盘、操纵杆以及其他的操作件。在驾驶操作件80安装有检测操作量或者操作的有无的传感器,其检测结果向自动驾驶控制装置100、或者行驶驱动力输出装置200、制动装置210及转向装置220中的一部分或全部输出。
[0047]
自动驾驶控制装置100例如具备第一控制部120、第二控制部160及存储部180。第一控制部120及第二控制部160分别例如通过cpu(central processing unit)、gpu(graphics processing unit)等硬件处理器执行程序(软件)来实现。这些构成要素中的一部分或全部也可以通过lsi(large scale integration)、asic(application specific integrated circuit)、fpga(field

programmable gate array)等硬件(包括电路部:circuitry)来实现,也可以通过软件与硬件的协同配合来实现。程序可以预先保存于自动驾驶控制装置100的hdd、闪存器等存储装置(具备非暂时性的存储介质的存储装置),也可以保存于dvd、cd

rom等能够装卸的存储介质,并通过存储介质(非暂时性的存储介质)装配于驱动装置来安装于自动驾驶控制装置100的hdd、闪存器。
[0048]
存储部180由上述的各种存储装置来实现。存储部180例如由hdd、闪存器、eeprom(electrically erasable programmable read only memory)、rom(read only memory)、或ram(random access memory)等实现。在存储部180中,例如除了保存由处理器读出并执行的程序之外,还保存基于规则的模型数据182、dnn(deep neural network(s))模型数据184等。关于基于规则的模型数据182、dnn模型数据184的详细情况,见后述。
[0049]
图2是实施方式的第一控制部120、第二控制部160及存储部180的功能结构图。第一控制部120例如具备识别部130和行动计划生成部140。
[0050]
第一控制部120例如并行实现基于ai(artificial intelligence:人工智能)的功能和基于预先给出的模型的功能。例如,“识别交叉路口”的功能可以通过“并行执行基于深度学习等的交叉路口的识别和基于预先给出的条件(存在能够图案匹配的信号、道路标示等)的识别,并对双方评分而综合地评价”来实现。由此,确保自动驾驶的可靠性。
[0051]
识别部130识别本车辆m的周边的状况或者环境。例如,识别部130基于从相机10、雷达装置12及lidar14经由物体识别装置16输入的信息,来识别存在于本车辆m的周边的物体。由识别部130识别的物体例如包括自行车、摩托车、四轮机动车、行人、道路标识、道路标示、划分线、电线杆、护栏、落下物等。另外,识别部130识别物体的位置、速度、加速度等状态。物体的位置例如识别为以本车辆m的代表点(重心、驱动轴中心等)为原点的相对坐标上的位置(即相对于本车辆m的相对位置),并使用于控制。物体的位置也可以由该物体的重心、角部等代表点来表示,也可以由表现出的区域来表示。物体的“状态”也可以包括物体的加速度、加加速度、或者“行动状态”(例如是否正在进行或者正要进行车道变更)。
[0052]
另外,识别部130例如识别本车辆m正在行驶的车道(以下称作本车道)、与该本车道相邻的相邻车道等。例如,识别部130通过对从第二地图信息62得到的道路划分线的图案
(例如实线与虚线的排列)与根据由相机10拍摄到的图像识别的本车辆m的周边的道路划分线的图案进行比较,来将划分线之间的空间识别为本车道、相邻车道。
[0053]
另外,识别部130不限于识别道路划分线,也可以通过识别道路划分线、包括路肩、缘石、中央隔离带、护栏等的行驶路边界(道路边界),来识别本车道、相邻车道这样的车道。在该识别中,也可以考虑从导航装置50取得的本车辆m的位置、基于ins的处理结果。另外,识别部130可以识别暂时停止线、障碍物、红灯、收费站、以及其他的道路现象。
[0054]
识别部130在识别本车道时,识别本车辆m相对于本车道的相对位置、姿态。识别部130例如也可以将本车辆m的基准点从车道中央的偏离、以及本车辆m的行进方向相对于将车道中央相连的线所成的角度识别为本车辆m相对于本车道的相对位置及姿态。也可以代替于此,识别部130将本车辆m的基准点相对于本车道的任意侧端部(道路划分线或道路边界)的位置等识别为本车辆m相对于本车道的相对位置。
[0055]
行动计划生成部140例如具备事件决定部142、风险区域算出部144及目标轨道生成部146。
[0056]
事件决定部142在决定有推荐车道的路径上本车辆m处于自动驾驶下的情况下,决定该自动驾驶的行驶形态。以下,将规定了自动驾驶的行驶形态的信息称作事件进行说明。
[0057]
在事件中,例如包括定速行驶事件、追随行驶事件、车道变更事件、分支事件、汇合事件、接管事件等。定速行驶事件是使本车辆m以恒定的速度在相同的车道上行驶的行驶形态。追随行驶事件是使本车辆m追随在本车道上存在于本车辆m的前方的规定距离以内(例如100[m]以内)且距本车辆m最近的其他车辆(以下称作先行车辆)的行驶形态。
[0058]“追随”例如可以是使本车辆m与先行车辆的车间距离(相对距离)维持为恒定的行驶形态,也可以是除了使本车辆m与先行车辆的车间距离维持为恒定以外还使本车辆m在本车道的中央行驶的行驶形态。
[0059]
车道变更事件是使本车辆m从本车道向相邻车道进行车道变更的行驶形态。分支事件是在道路的分支地点使本车辆m向目的地侧的车道分支的行驶形态。汇合事件是在汇合地点使本车辆m向干线汇合的行驶形态。接管事件是结束自动驾驶并切换为手动驾驶的行驶形态。
[0060]
另外,在事件中,例如也可以包括赶超事件、躲避事件等。赶超事件是使本车辆m暂且向相邻车道进行车道变更并在相邻车道上赶超先行车辆后再次向原来的车道进行车道变更的行驶形态。躲避事件是为了躲避存在于本车辆m的前方的障碍物而使本车辆m进行制动及转向中的至少一方的行驶形态。
[0061]
另外,事件决定部142例如可以根据在本车辆m行驶时由识别部130识别到的周边的状况,将对当前的区间已经决定的事件变更为其他的事件、对当前的区间决定新的事件。
[0062]
风险区域算出部144算出在由识别部130识别出的物体的周围潜在地分布的、或者潜在地存在的风险的区域(以下称作风险区域ra)。风险例如是物体对本车辆m带来的风险。更具体而言,风险可以是由于先行车辆急减速、其他车辆从相邻车道向本车辆m的前方插队而强使本车辆m进行急制动这样的风险,也可以是由于行人、自行车进入车道而强使本车辆m进行急转向这样的风险。另外,风险也可以是本车辆m给物体带来的风险。以下,将这样的风险的高低作为定量的指标值来处理,并将该指标值称作“潜在风险值p”进行说明。
[0063]
图3是用于说明风险区域ra的图。图中lni表示划分本车道的一方的划分线,ln2表
示划分本车道的另一方、且划分相邻车道的一方的划分线。ln3表示划分相邻车道的另一方的划分线。这些多个划分线中的、ln1及ln3为车道外侧线,ln2为允许车辆为了赶超而超出的中央线。另外,在图示的例子中,在本车道上的本车辆m的前方存在先行车辆m1。图中x表示车辆的行进方向,y表示车辆的宽度方向,z表示铅垂方向。
[0064]
在图示的状况的情况下,在风险区域ra中,越是靠近车道外侧线ln1及ln3的区域,则风险区域算出部144越提高潜在风险值p,越是远离车道外侧线ln1及ln3的区域,则风险区域算出部144越降低潜在风险值p。
[0065]
另外,在风险区域ra中,越是靠近中央线ln2的区域,则风险区域算出部144越提高潜在风险值p,越是远离中央线ln2的区域,则风险区域算出部144越降低潜在风险值p。中央线ln2与车道外侧线ln1及ln3不同,允许车辆超出,因此风险区域算出部144使针对中央线ln2的潜在风险值p比针对车道外侧线ln1及ln3的潜在风险值p低。
[0066]
另外,在风险区域ra中,越是靠近作为物体的一种的先行车辆m1的区域,则风险区域算出部144越提高潜在风险值p,越是远离先行车辆m1的区域,则风险区域算出部144越降低潜在风险值p。即,可以的是,在风险区域ra中,本车辆m与先行车辆m1的相对距离越短,则风险区域算出部144越提高潜在风险值p,本车辆m与先行车辆m1的相对距离越长,则风险区域算出部144越降低潜在风险值p。此时,可以的是,先行车辆m1的绝对速度、绝对加速度越大,则风险区域算出部144越提高潜在风险值p。另外,对于潜在风险值p,也可以代替先行车辆m1的绝对速度、绝对加速度或者除此之外还根据本车辆m与先行车辆m1的相对速度、相对加速度、ttc(time to collision)等来适当决定。
[0067]
图4是表示某坐标x1处的y方向上的潜在风险值p的变化的图。图中y1表示y方向上的车道外侧线ln1的位置(坐标),y2表示y方向上的中央线ln2的位置(坐标),y3表示y方向上的车道外侧线ln3的位置(坐标)。
[0068]
如图示那样,在车道外侧线ln1所存在的坐标(x1、y1)的附近、车道外侧线ln3所存在的坐标(x1、y3)的附近,潜在风险值p最高,在中央线ln2所存在的坐标(x1、y2)的附近,潜在风险值p相对于坐标(x1、y1)、(x1、y3)次高。如后所述,在潜在风险值p与预先决定的阈值th相同或为该预先决定的阈值th以上的区域,为了防止车辆进入该区域,不生成目标轨道tr。
[0069]
图5是表示某坐标x2处的y方向上的潜在风险值p的变化的图。坐标x2比坐标x1靠近先行车辆m1。因此,虽然在车道外侧线ln1所存在的坐标(x2、y1)与中央线ln2所存在的坐标(x2、y2)之间的区域不存在先行车辆m1,但是考虑先行车辆m1进行急减速等风险。其结果是,(x2、y1)与(x2、y2)之间的区域的潜在风险值p容易比(x1、y1)与(x1、y2)之间的区域的潜在风险值p高,例如为阈值th以上。
[0070]
图6是表示某坐标x3处的y方向上的潜在风险值p的变化的图。在坐标x3存在先行车辆m1。因此,车道外侧线ln1所存在的坐标(x3、y1)与中央线ln2所存在的坐标(x3、y2)之间的区域的潜在风险值p比(x2、y1)与(x2、y2)之间的区域的潜在风险值p高、且为阈值th以上。
[0071]
图7是表示某坐标y4处的x方向上的潜在风险值p的变化的图。坐标y4是y1与y2的中间坐标,在该坐标y4存在先行车辆m1。因此,坐标(x3、y4)处的潜在风险值p最高,比坐标(x3、y4)远离先行车辆m1的坐标(x2、y4)处的潜在风险值p比坐标(x3、y4)处的潜在风险值p
低,比坐标(x2、y4)进一步远离先行车辆m1的坐标(x1、y4)处的潜在风险值p比坐标(x2、y4)处的潜在风险值p低。
[0072]
图8是表示决定了潜在风险值p的风险区域ra的图。如图示那样,风险区域算出部144用多个网格(mesh)(也称作格子:grid)划分风险区域ra,并将这些多个网格分别与潜在风险值p建立对应关系。例如,网格(x
i
、y
j
)与潜在风险值p
ij
建立对应关系。即,风险区域ra由向量、张量这样的数据构造表示。
[0073]
风险区域算出部144当将多个网格与潜在风险值p建立对应关系时,将各网格的潜在风险值p归一化。
[0074]
例如,可以的是,风险区域算出部144以潜在风险值p的最大值为1且最小值为0的方式将潜在风险值p归一化。具体而言,风险区域算出部144从风险区域ra中包括的全网格的潜在风险值p中选择取最大值的潜在风险值p
max
、以及取最小值的潜在风险值p
min
。风险区域算出部144从风险区域ra中包括的全网格中选出某着眼的一个网格(x
y
、y
j
),并从与该网格(x
i
、y
j
)建立了对应关系的潜在风险值p
ij
减去最小的潜在风险值p
min
,并且从最大的潜在风险值p
max
减去最小的潜在风险值p
min
,并将(p
ij

p
min
)除以(p
max

p
min
)。风险区域算出部144一边改变着眼的网格,一边反复进行上述处理。由此,风险区域ra以潜在风险值p的最大值为1且最小值为0的方式归一化。
[0075]
另外,风险区域算出部144也可以算出风险区域ra中包括的全网格的潜在风险值p的平均值μ和标准偏差σ,并从与网格(x
i
、y
j
)建立了对应关系的潜在风险值p
ij
减去平均值μ,并将(p
ij

μ)除以标准偏差σ。由此,风险区域ra以潜在风险值p的最大值为1且最小值为0的方式归一化。
[0076]
另外,风险区域算出部144可以以潜在风险值p的最大值为任意的m且最小值为任意的m的方式将潜在风险值p归一化。具体而言,风险区域算出部144在使(p
ij

p
min
)/(p
max

p
min
)为a的情况下,将该a乘以(m

m),并将a(m

m)加上m。由此,风险区域ra以潜在风险值p的最大值为m且最小值为m的方式归一化。
[0077]
返回图2的说明。为了原则上本车辆m在由推荐车道决定部61决定的推荐车道上行驶、而且本车辆m在推荐车道上行驶时应对周边的状况,目标轨道生成部146生成以由事件规定的行驶形态使本车辆m自动地(不依赖于驾驶员的操作地)行驶的将来的目标轨道tr。在目标轨道tr中,例如包括确定将来的本车辆m的位置的位置要素、以及确定将来的本车辆m的速度等的速度要素。
[0078]
例如,目标轨道生成部146将本车辆m应该按顺序到达的多个地点(轨道点)决定为目标轨道tr的位置要素。轨道点是每隔规定的行驶距离(例如数[m]程度)的本车辆m应该到达的地点。规定的行驶距离例如可以通过沿路径行进时的沿途距离来计算。
[0079]
另外,目标轨道生成部146将每隔规定的采样时间(例如零点几[sec]程度)的目标速度v及目标加速度α决定为目标轨道tr的速度要素。另外,轨道点也可以是每隔规定的采样时间的、在该采样时刻的本车辆m应该到达的位置。在该情况下,目标速度v、目标加速度α由采样时间及轨道点的间隔决定。
[0080]
例如,目标轨道生成部146从存储部180读出基于规则的模型数据182、dnn模型数据184等,并使用由读出的各数据定义的模型来生成目标轨道tr。
[0081]
基于规则的模型数据182是定义了一个或多个基于规则的模型mdl1的信息(程序
或数据构造)。基于规则的模型mdl1是基于由专家等预先决定的规则组而根据风险区域ra导出目标轨道tr的模型。专家等决定规则组,因此这样的基于规则的模型mdl1也称作专家系统。规则组包括道路交通法等法律、规则、惯例等。基于规则的模型mdl1是“第一模型”的一例。
[0082]
例如,在规则组中可能存在目标轨道trx与某条件x唯一建立了对应关系的规则。条件x例如是向基于规则的模型mdl1输入的风险区域ra与在本车辆m正于单侧一车道的道路上行驶、且在本车辆m的前方的规定距离以内存在时速xx[km/h]的先行车辆时可能生成的风险区域ra
x
相同。目标轨道trx例如是目标速度为v
x
、目标加速度为α
x
、转向的位移量为u
x
、轨道的曲率为κ
x
的目标轨道tr。在遵循了这样的规则的情况下,基于规则的模型mdl1当输入满足条件x这样的风险区域ra时,输出目标轨道trx。
[0083]
虽然专家等决定规则组,但是包罗地决定出所有的规则这一情况较为稀少。因此,也设想本车辆m陷入不存在于规则组的状况(专家未设想的状况),有时向基于规则的模型mdl1输入不属于规则组的风险区域ra。在该情况下,基于规则的模型mdl1不会输出目标轨道tr。代替于此,基于规则的模型mdl1也可以在输入了不属于规则组的风险区域ra的情况下,输出以预先决定的速度在当前的车道上行驶这样的不依存于现状的风险区域ra的预先决定的目标轨道tr。即,也可以包括在向规则组中输入了未事先设想的风险区域ra的情况下输出不依存于现状的风险区域ra的预先决定的目标轨道tr这样的、用于应对不规则的状况的通用的规则。
[0084]
dnn模型数据184是定义了一个或多个dnn模型mdl2的信息(程序或数据构造)。dnn模型mdl2是以当输入风险区域ra时输出目标轨道tr的方式进行了学习的深度学习模型。具体而言,dnn模型mdl2可以是cnn(convolutional neural network)、rnn(reccurent neural network)、或者它们的组合。在dnn模型数据184中,例如包括构成神经网络的多个层分别包括的单元互相以怎样的方式耦合这样的耦合信息、对所耦合的单元间输入输出的数据赋予的耦合系数等各种信息。dnn模型mdl2是“第二模型”的一例。
[0085]
所谓耦合信息,例如包括各层所包含的单元数、指定各单元的耦合对象的单元的种类的信息、各单元的激活函数、设置于隐含层的单元间的门(gate)等信息。激活函数例如既可以是修正线性函数(relu函数),也可以是sigmoid函数、step函数、以及其他的函数等。门例如根据由激活函数返回的值(例如1或0),使在单元间传递的数据选择性地通过、加权。耦合系数例如包括在神经网络的隐含层中从某层的单元向更深的层的单元输出数据时,对输出数据赋予的权重系数。另外,耦合系数也可以包括各层的固有的偏置成分等。
[0086]
dnn模型mdl2例如基于教示数据充分地进行学习。教示数据例如是相对于风险区域ra而将dnn模型mdl2应该输出的正确解的目标轨道tr作为教示标签(也称作目标)建立了对应关系的数据集。即,教示数据是将作为输入数据的风险区域ra、以及作为输出数据的目标轨道tr进行了组合的数据集。正确解的目标轨道tr例如可以是通过在风险区域ra所包括的多个网格中潜在风险值p小于阈值th、且潜在风险值p最低的网格的目标轨道。另外,正确解的目标轨道tr例如可以是在某风险区域ra下实际上驾驶员进行了驾驶的车辆的轨道。
[0087]
目标轨道生成部146对基于规则的模型mdl1、dnn模型mdl2分别输入由风险区域算出部144算出的风险区域ra,并基于输入了该风险区域ra的各模型mdl的输出结果,来生成目标轨道tr。
[0088]
图9是示意性地表示目标轨道tr的生成方法的图。例如,目标轨道生成部146在选择了某dnn模型mdl2的情况下,对该dnn模型mdl2输入表示风险区域ra的向量或者张量。在图示的例子中,风险区域ra表示为m行n列的二阶的张量。输入了表示风险区域ra的向量或者张量的模型mdl输出目标轨道tr。该目标轨道tr例如由包括目标速度v、目标加速度α、转向的位移量u、轨道的曲率κ这样的多个要素的向量或者张量表示。
[0089]
图10是表示模型mdl输出的目标轨道tr的一例的图。如图示的例子那样,先行车辆m1的周边的潜在风险值p变高,因此为了躲避该先行车辆m1而生成目标轨道tr。其结果是,本车辆m向由划分线ln2及ln3划分的相邻车道进行车道变更并赶超先行车辆m1。
[0090]
返回图2的说明。第二控制部160控制行驶驱动力输出装置200、制动装置210及转向装置220,以使本车辆m按预定的时刻通过由目标轨道生成部146生成的目标轨道tr。第二控制部160例如具备第一取得部162、速度控制部164及转向控制部166。第二控制部160是“驾驶控制部”的一例。
[0091]
第一取得部162从目标轨道生成部146取得目标轨道tr,并使存储部180的存储器存储该目标轨道tr。
[0092]
速度控制部164基于存储于存储器的目标轨道tr中包括的速度要素(例如目标速度v、目标加速度α等),来控制行驶驱动力输出装置200及制动装置210的一方或双方。
[0093]
转向控制部166根据存储于存储器的目标轨道中包括的位置要素(例如目标轨道的曲率κ、与轨道点的位置相应的转向的位移量u等),来控制转向装置220。
[0094]
速度控制部164及转向控制部166的处理例如通过前馈控制与反馈控制的组合来实现。作为一例,转向控制部166将与本车辆m的前方的道路的曲率相应的前馈控制与基于从目标轨道tr的偏离的反馈控制组合来执行。
[0095]
行驶驱动力输出装置200将用于车辆行驶的行驶驱动力(转矩)向驱动轮输出。行驶驱动力输出装置200例如具备内燃机、电动机及变速器等的组合、以及控制它们的功率ecu(electronic control unit)。功率ecu按照从第二控制部160输入的信息、或者从驾驶操作件80输入的信息,来控制上述的结构。
[0096]
制动装置210例如具备制动钳、向制动钳传递液压的液压缸、使液压缸产生液压的电动马达、以及制动ecu。制动ecu按照从第二控制部160输入的信息、或者从驾驶操作件80输入的信息来控制电动马达,以使与制动操作相应的制动转矩向各车轮输出。制动装置210可以具备将通过驾驶操作件80中包括的制动踏板的操作产生的液压经由主液压缸向液压缸传递的机构作为备用。需要说明的是,制动装置210不限于上述说明的结构,也可以是按照从第二控制部160输入的信息来控制致动器将主液压缸的液压向液压缸传递的电子控制式液压制动装置。
[0097]
转向装置220例如具备转向ecu和电动马达。电动马达例如使力作用于齿条

小齿轮机构来变更转向轮的朝向。转向ecu按照从第二控制部160输入的信息、或者从驾驶操作件80输入的信息,来驱动电动马达,使转向轮的朝向变更。
[0098]
[处理流程]
[0099]
以下,使用流程图来说明由实施方式的自动驾驶控制装置100进行的一系列处理的流程。图11是表示由实施方式的自动驾驶控制装置100进行的一系列处理的流程的一例的流程图。本流程图的处理例如可以以规定的周期反复执行。
[0100]
首先,识别部130识别在本车辆m正在行驶的道路上存在的物体(步骤s100)。该物体可以是如上述那样道路上的划分线、行人、相向车辆这样的各种的物体。
[0101]
接着,风险区域算出部144基于划分线的位置、种类、周边的其他车辆的位置、速度、朝向等,来算出风险区域ra(步骤s102)。
[0102]
例如,风险区域算出部144将预先决定的范围分为多个网格,关于该多个网格分别算出潜在风险值p。而且,风险区域算出部144算出潜在风险值p与各网格建立了对应关系的向量或张量作为风险区域ra。此时,风险区域算出部144将潜在风险值p归一化。
[0103]
接着,目标轨道生成部146对基于规则的模型mdl1和dnn模型mdl2分别输入由风险区域算出部144算出的风险区域ra(步骤s104)。
[0104]
接着,目标轨道生成部146从基于规则的模型mdl1取得目标轨道tr,并且从dnn模型mdl2取得目标轨道tr(步骤s106)。以下,将从基于规则的模型mdl1取得的目标轨道tr称作“第一目标轨道tr1”,将从dnn模型mdl2取得的目标轨道tr称作“第二目标轨道tr2”来进行说明。
[0105]
接着,目标轨道生成部146判定在基于第一目标轨道tr1来自动地控制本车辆m的驾驶的第一条件下、以及基于第二目标轨道tr2来自动地控制本车辆m的驾驶的第二条件下这双方的条件下,是否会出现在本车辆m的速度成为规定值以下之后本车辆m在规定的范围内加速这一情况(步骤s108)。规定值例如也可以是零[km/h],也可以是能够视作本车辆m停止了的数[km/h]程度的速度。规定的范围可以是例如以重力加速度为基准的从0到数[g]程度的范围,以免对本车辆m的乘员施加急剧的加速度。即,目标轨道生成部146可以判定在第一条件下和第二条件下这双方的条件下是否都会出现在暂时停止之后本车辆m在不会对乘员施加过度的加速度的范围内加速这一情况。
[0106]
例如,目标轨道生成部146可以参照在第一目标轨道tr1及第二目标轨道tr2中分别作为速度要素而包含的目标速度v、目标加速度α,来判定是否会出现在本车辆m的速度成为规定值以下之后本车辆m在规定的范围内加速这一情况。
[0107]
图12是表示本车辆m可能遭遇的场景的一例的图。在使本车辆m于图示这样的交叉路口右转的情况下,需要在不妨碍相向车辆m2的行进的情况下使本车辆m顺畅地自动驾驶。例如,在本车辆m比相向车辆m2早到达交叉路口的情况下,自动驾驶控制装置100使本车辆m一边减速一边进入交叉路口内,并使本车辆m在该场地暂时地停止直到相向车辆m2通过交叉路口。而且,当相向车辆m2通过交叉路口时,自动驾驶控制装置100使本车辆m一边加速一边左转。即,在交叉路口这样的场景中,可能出现在本车辆m的速度成为规定值以下之后本车辆m在规定的范围内加速这一情况。
[0108]
在这样的情况下,识别部130预测所识别的物体将会行进的将来的轨道tr#。例如,若识别出的物体为相向车辆m2、且该相向车辆m2未使转向灯闪烁,则识别部130将相向车辆m2直行这样的轨道预测为相向车辆m2的将来的轨道tr#。
[0109]
而且,目标轨道生成部146判定由识别部130预测的相向车辆m2的将来的轨道tr#是否与第一目标轨道tr1及第二目标轨道tr2这双方交叉。目标轨道生成部146在相向车辆m2的将来的轨道tr#与第一目标轨道tr1及第二目标轨道tr2这双方交叉的情况下,判定为会出现在本车辆m的速度成为规定值以下之后本车辆m在规定的范围内加速这一情况。
[0110]
返回图11的流程图的说明。目标轨道生成部146在判定为会出现在本车辆m的速度
成为规定值以下之后本车辆m在规定的范围内加速这一情况时,选择第一目标轨道tr1及第二目标轨道tr2中的第二目标轨道tr2(步骤s110)。
[0111]
另一方面,目标轨道生成部146在判定为不会出现在本车辆m的速度成为规定值以下之后本车辆m在规定的范围内加速这一情况时,选择第一目标轨道tr1及第二目标轨道tr2中的更优的目标轨道tr(步骤s112)。
[0112]
例如,目标轨道生成部146可以从目标轨道tr的平滑度、加减速的平缓度这样的观点出发来评价各目标轨道tr,选择评价较高的目标轨道tr作为最优的目标轨道tr。更具体而言,目标轨道生成部146可以选择曲率κ最小、目标加速度α最小的目标轨道tr作为最优的目标轨道tr。需要说明的是,最优的目标轨道tr的选择并不限定于此,也可以考虑其他的观点等来进行该选择。
[0113]
接着,第二控制部160基于由目标轨道生成部146选择出的目标轨道tr,来控制本车辆m的速度及转向中的至少一方(步骤s114)。由此本流程图的处理结束。
[0114]
图13是表示基于目标轨道tr来控制本车辆m的驾驶的场景的一例的图。在图示的场景中,本车辆m先到达了交叉路口,因此会出现在本车辆m的速度成为规定值以下之后本车辆m在规定的范围内加速这一情况。因此,不选择第一目标轨道tr1而选择第二目标轨道tr2。
[0115]
如上所述,第一目标轨道tr1是由基于规则的模型mdl1输出的目标轨道tr,第二目标轨道tr2是由dnn模型mdl2输出的目标轨道tr。
[0116]
考虑基于第一目标轨道tr1来控制本车辆m的驾驶这一情况。在该情况下,第一目标轨道tr1基于规则组而导出,因此在遵守若相向车辆m2与本车辆m之间的ttc为阈值以上则右转这样的规则的同时控制本车辆m的驾驶。考虑在这样的情况下,若连续存在若干台相向车辆m2,则无论何时都不能右转而在交叉路口内长时间停留。
[0117]
另一方面,考虑到基于第二目标轨道tr2来控制本车辆m的驾驶这一情况。在该情况下,第二目标轨道tr2通过学习了驾驶员的驾驶的倾向的cnn、rnn等而导出,因此可以期待即使在基于规则而本车辆m卡住这样的状况下也以解决这样的状况的方式控制本车辆m的驾驶。
[0118]
通常,即使在相向车辆m2与本车辆m之间的ttc小于阈值的状况下,也期待相向车辆m2减速而开始右转的驾驶员较多。通过使这样的驾驶员进行了手动驾驶时的车辆的轨道作为dnn模型mdl2的教示数据,从而即使相向车辆m2与本车辆m之间的ttc小于阈值,dnn模型mdl2也能够输出使本车辆m右转这样的第二目标轨道tr2。换言之,关于相向车辆m2与本车辆m之间的ttc的阈值(决定右转的可否的ttc的阈值),可以期待在dnn模型mdl2的情况下比在基于规则的模型mdl1的情况下大。
[0119]
由此,在按照第一目标轨道tr1及第二目标轨道tr2中的任一方都是会出现在本车辆m的速度成为规定值以下之后本车辆m在规定的范围内加速这一情况时,优先地选择第二目标轨道tr2。其结果是,能够在交叉路口这样的场景更顺畅地自动地控制本车辆m的驾驶。
[0120]
根据以上说明的实施方式,自动驾驶控制装置100识别存在于本车辆m的周边的划分线、相向车辆这样的各种的物体,并算出在该物体的周围潜在地存在的风险的区域即风险区域ra。而且,自动驾驶控制装置100对基于规则的模型mdl1及dnn模型mdl2这双方输入风险区域ra,并基于各模型的输出结果来生成目标轨道tr。自动驾驶控制装置100基于目标
轨道tr来自动地控制本车辆m的驾驶。此时,自动驾驶控制装置100在基于由基于规则的模型mdl1输出的第一目标轨道tr1来控制本车辆m的驾驶的第一条件下、以及基于由dnn模型mdl2输出的第二目标轨道tr2来控制本车辆m的驾驶的第二条件下这双方的条件下,会出现在本车辆m的速度成为规定值以下之后本车辆m在规定的范围内加速这一情况时,选择第一目标轨道tr1及第二目标轨道tr2中的第二目标轨道tr2。其结果是,能够在交叉路口这样的场景中更顺畅地控制本车辆m的驾驶。
[0121]
<实施方式的变形例>
[0122]
以下说明上述的实施方式的变形例。在上述的实施方式中,说明了目标轨道生成部146对基于规则的模型mdl1及dnn模型mdl2分别输入风险区域ra并基于各模型的输出结果来生成目标轨道tr的情况,但并不限定于此。例如,目标轨道生成部146也可以对基于模型或基于称作基于模型的设计的方法做出的模型(以下称作基于模型的模型)输入风险区域ra,由此使基于模型的模型输出目标轨道tr。基于模型的模型是通过利用模型预测控制(model predictive control:mpc)等最优化方法根据风险区域ra来决定(或输出)目标轨道tr的模型。基于模型的模型是“第一模型”的另一例。
[0123]
另外,目标轨道生成部146也可以通过对二叉树型的模型、博弈树型的模型、使低层神经网络如波茨曼机那样相互耦合而得到的模型、强化学习模型、深层强化学习模型这样的以其他的机器学习为基础的模型输入风险区域ra,来使其他的机器学习模型输出目标轨道tr。强化学习例如是进行反复试错、或者通过将成为目标轨道tr时被最优化的评价函数最优化来进行学习的学习法。二叉树型的模型、博弈树型的模型、使低层神经网络如波茨曼机这样相互耦合的模型、强化学习模型、深层强化学习模型等是“第二模型”的另一例。
[0124]
[硬件结构]
[0125]
图14是表示实施方式的自动驾驶控制装置100的硬件结构的一例的图。如图所示,自动驾驶控制装置100成为通信控制器100

1、cpu100

2、作为工作存储器使用的ram100

3、保存引导程序等的rom100

4、闪存器、hdd等存储装置100

5、驱动装置100

6等通过内部总线或专用通信线相互连接而成的结构。通信控制器100

1进行与自动驾驶控制装置100以外的构成要素之间的通信。存储装置100

5保存cpu100

2执行的程序100

5a。该程序通过dma(direct memory access)控制器(未图示)等向ram100

3展开,并由cpu100

2执行。由此,实现第一控制部及第二控制部160中的一部分或全部。
[0126]
上述说明的实施方式能够如以下这样表现。
[0127]
一种车辆控制装置,其构成为具备:
[0128]
保存有程序的至少一个以上的存储器;以及
[0129]
至少一个以上的处理器,
[0130]
所述处理器通过执行所述程序来进行如下处理:
[0131]
识别存在于车辆的周边的物体;
[0132]
算出在所述识别的物体的周围分布的风险的区域;
[0133]
对当输入所述区域时输出所述车辆应该行驶的目标轨道的多个模型分别输入所述算出的区域,并基于输入了所述区域的所述多个模型各自的输出结果来生成多个所述目标轨道;
[0134]
基于所述生成的目标轨道来自动地控制所述车辆的驾驶;以及
[0135]
在所述多个模型中包括第一模型和第二模型,所述第一模型是根据所述区域输出所述目标轨道的基于规则或基于模型的模型,所述第二模型是以当输入所述区域时输出所述目标轨道的方式进行了学习的基于机器学习的模型,
[0136]
在基于由所述第一模型输出的所述目标轨道即第一目标轨道来控制所述车辆的驾驶的第一条件下会出现在所述车辆的速度成为规定值以下之后所述车辆加速这一情况、且在基于由所述第二模型输出的所述目标轨道即第二目标轨道来控制所述车辆的驾驶的第二条件下会出现在所述车辆的速度成为规定值以下之后所述车辆加速这一情况时,选择所述第一目标轨道及所述第二目标轨道中的所述第二目标轨道。
[0137]
以上使用实施方式说明了本发明的具体实施方式,但本发明丝毫不被这样的实施方式限定,在不脱离本发明的主旨的范围内能够施加各种变形及替换。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜