技术新讯 > 控制调节装置的制造及其应用技术 > 一种多域耦合的能量管理方法和装置与流程 > 正文

一种多域耦合的能量管理方法和装置与流程

国知局
2024-07-31 23:54:17

本发明涉及分布式动力单元能量管理，特别是涉及一种多域耦合的能量管理方法和装置。

背景技术：

1、分布式动力单元可增加系统可靠性，降低能源损失，具有适应性好、环境友好等优势，已经成为平台领域的重要研究方向。然而，现有技术中各耗能部件的能量使用没有规划，造成能量分配不合理。尤其对于分布式动力系统，没有或不合理的能量分配，造成各部件协同工作效率大大降低甚至无法工作。此外，能量形式的不同也给能量管理带来了巨大的挑战。发动机-发电机一体化发电装置是一种混合动力系统。燃油产生的化学能、热能和电池产生的电能、磁能在系统中是一种耦合关系。这种多域耦合的能量难以解耦管理。由于纯电动力系统和混合动力系统有着本质的区别，因此需要进行能量管理策略优化，将混合动力平台的特定动态参数有针对性的纳入设计策略中。

2、基于此，亟需一种新型多域耦合的能量管理方法。

技术实现思路

1、本发明的目的在于提供一种分布式动力单元的能量管理方法及系统，其能够在线实时输出能量管理策略，在满足平台性能前提下最小化燃油消耗，并同时实现电池荷电状态维稳和机组输出功率平衡。

2、为实现上述目的，本发明提供一种多域耦合的能量管理方法，其包括：

3、分布式平台单个车辆动力系统包括动力电池、内燃机、发电机、驱动电机和控制系统；

4、采集分布式平台单个车辆动力系统的参数，将分布式平台单个车辆动力系统的参数输入能量管理控制器中，输出发动机转矩；

5、其中，能量管理控制器包括预先设置下式(1)的策略网络，式(1)是根据车辆动力系统模型，以车辆队列模型中每个节点的期望状态和输入，将稳定性、舒适性和经济性作为优化目标建立的分布式平台多目标优化函数，转化而成的预测优化问题；

6、

7、式中，ui表示车辆队列模型中节点i在预测时域[t,t+np-1]内待优化的控制变量序列，表示节点i在t+np-1时刻的控制变量，ji表示节点i代价函数，表示节点i的预测控制输出，表示节点i的预测控制输入，表示节点i的假定控制输出，表示节点i的假定控制输出，jj,i(k|t)表示节点i在第t+k时刻的第j个代价函数，k表示预测时域[t,t+np-1]内的第t+k时刻。

8、进一步地，能量管理控制器通过同时训练策略网络和价值网络获得，价值网络预先设置有下式(2)：

9、

10、式中，ti、vi、soci分别表示节点i的期望转矩、车速和电池的电荷状态，三者共同组成状态变量oi；pi表示节点i的辅助动力源，组成动作ai；mfuel,i表示节点i的燃油消耗，socref表示将电池维持在最佳状态用的电量参考值，α表示平衡系数，三者与soci组成奖励值ri。

11、进一步地，车辆队列模型的离散非线性动力学模型表示为下式(3)：

12、

13、式中，x(t+1)表示t+1时刻车辆队列模型中所有节点的状态向量，xi(t+1)表示节点i的在时刻t+1的状态变量，包括车辆的位置、速度和车轮转矩；x(t)表示t时刻所有节点的状态向量，xi(t)表示节点i的在时刻t的状态变量；a表示状态转移矩阵a(t)，表示t时刻所有节点的状态转移，si(t)、vi(t)分别表示节点i的位移、速度，δt表示一个时间步长，ηi表示节点i的机械传动系统效率，ti(t)表示节点i的车轮的实际驱动、制动转矩，ca,i＝cda/2表示综合空气阻力系数，cd表示节点i的风阻系数，a表示节点i的车头正面投影面积，mi表示节点i的质量，fi表示节点i的滚动阻力系数，τi表示节点i的车辆动力系统迟滞系数；b表示n个控制矩阵所组成的对角阵b(t)，b(t)＝diag{b1,b2,…,bi…,bn}，bi＝[0,0,δt/τi]；u(t)表示n个控制向量所组成的矩阵，表示节点i的控制向量，为ti(t)的一阶导数；y(t)表示n个观测向量组成的矩阵，yi(t)＝cxi(t)，表示节点i的观测向量；c表示n个观测矩阵所组成的对角矩阵，c＝diag{c1,c2,…,ci…,cn}，表示第i个观测矩阵，上标t表示矩阵转置。

14、进一步地，车辆动力系统中，将动力电池为主要动力源，内燃机就和发电机组成一个辅助动力源，在动力电池电量不足时，辅助动力源为电池和驱动电机供电，则车辆动力系统模型包括：

15、a.反映发动机效率的效率map图，策略网络和价值网络的训练过程中以效率map图的最佳燃油消耗量曲线为基础；

16、b.由式(4)描述的t+k时刻节点i的电动机功率pi(k|t)：

17、

18、式中，ti(k|t)为节点i在时刻t+k的转矩，vi(k|t)为节点i在时刻t+k的速度，ηd表示驱动效率，ηb表示再生制动效率；

19、c.由式(5)描述的电池模型：

20、

21、式中，soc(t)为t时刻的荷电状态，为soc(t)的一阶导数，pb表示电池的输出功率，qb表示电池标称容量，rb表示电池的内阻，voc表示电池的开路电压。

22、进一步地，车辆队列模型中节点i的期望状态xi,r(t)和输入ui,r(t)表示为式(6)：

23、

24、式中，si,r(t)表示节点i的期望位移，vi,r(t)表示节点i的期望车速，ti,r(t)表示节点i的期望驱动、制动转矩，

25、分布式平台多目标优化函数包括式(7)-(11)：

26、

27、

28、

29、

30、j5,i(k|t)＝||wipi(k|t)||2 (11)

31、式中，j1,i(k|t)、j2,i(k|t)分别表示节点之间在时刻t+k的间距误差代价函数；j3,i(k|t)表示节点i在t+k时刻的舒适性代价函数；j4,i(k|t)表示节点i在t+k时刻的稳定性代价函数；j5,i(k|t)表示节点i在t+k时刻的经济性代价函数；qi表示节点i的跟随误差系数矩阵；gi表示节点i假设轨迹的误差系数矩阵；ri表示节点i舒适性系数矩阵；fi表示节点间通信稳定性矩阵；wi表示节点i能耗系数矩阵，上述矩阵均为对称非负定矩阵；表示节点i在t+k时刻的预测控制输出，yi,r(k|t)表示节点i在t+k时刻的期望控制输出，为节点i'在t+k时刻的假定控制输出，为车辆节点之间的距离偏差，表示节点i在t+k时刻的预测控制输入，hi为节点i的行驶阻力方程，由t+k时刻的预测车速决定，为节点i在t+k时刻的假定控制输出，|| ||2为取二范数。

32、本发明还提供一种多域耦合的能量管理装置，其包括参数获取单元和能量管理控制器，其中：

33、参数获取单元用于采集分布式平台单个车辆动力系统的参数；其中，分布式平台单个车辆动力系统包括动力电池、内燃机、发电机、驱动电机和控制系统；

34、能量管理控制器用于接收分布式平台单个车辆动力系统的参数，输出发动机转矩；其中，能量管理控制器包括预先设置下式(1)的策略网络，式(1)是根据车辆动力系统模型，以车辆队列模型中每个节点的期望状态和输入，将稳定性、舒适性和经济性作为优化目标建立的分布式平台多目标优化函数，转化而成的预测优化问题；

35、

36、式中，ui表示车辆队列模型中节点i在预测时域[t,t+np-1]内待优化的控制变量序列，表示节点i在t+np-1时刻的控制变量，ji表示节点i代价函数，表示节点i的预测控制输出，表示节点i的预测控制输入，表示节点i的假定控制输出，表示节点i的假定控制输出，jj,i(k|t)表示节点i在第t+k时刻的第j个代价函数，k表示预测时域[t,t+np-1]内的第t+k时刻。

37、进一步地，能量管理控制器通过同时训练策略网络和价值网络获得，价值网络预先设置有下式(2)：

38、

39、式中，ti、vi、soci分别表示节点i的期望转矩、车速和电池的电荷状态，三者共同组成状态变量oi；pi表示节点i的辅助动力源，组成动作ai；mfuel,i表示节点i的燃油消耗，socref表示将电池维持在最佳状态用的电量参考值，α表示平衡系数，三者与soci组成奖励值ri。

40、进一步地，车辆队列模型的离散非线性动力学模型表示为下式(3)：

41、

42、式中，x(t+1)表示t+1时刻车辆队列模型中所有节点的状态向量，xi(t+1)表示节点i的在时刻t+1的状态变量，包括车辆的位置、速度和车轮转矩；x(t)表示t时刻所有节点的状态向量，xi(t)表示节点i的在时刻t的状态变量；a表示状态转移矩阵a(t)，表示t时刻所有节点的状态转移，si(t)、vi(t)分别表示节点i的位移、速度，δt表示一个时间步长，ηi表示节点i的机械传动系统效率，ti(t)表示节点i的车轮的实际驱动、制动转矩，ca,i＝cda/2表示综合空气阻力系数，cd表示节点i的风阻系数，a表示节点i的车头正面投影面积，mi表示节点i的质量，fi表示节点i的滚动阻力系数，τi表示节点i的车辆动力系统迟滞系数；b表示n个控制矩阵所组成的对角阵b(t)，b(t)＝diag{b1,b2,…,bi…,bn}，bi＝[0,0,δt/τi]；u(t)表示n个控制向量所组成的矩阵，表示节点i的控制向量，为ti(t)的一阶导数；y(t)表示n个观测向量组成的矩阵，yi(t)＝cxi(t)，表示节点i的观测向量；c表示n个观测矩阵所组成的对角矩阵，c＝diag{c1,c2,…,ci…,cn}，表示第i个观测矩阵，上标t表示矩阵转置。

43、进一步地，车辆动力系统中，将动力电池为主要动力源，内燃机就和发电机组成一个辅助动力源，在动力电池电量不足时，辅助动力源为电池和驱动电机供电，则车辆动力系统模型包括：

44、a.反映发动机效率的效率map图，策略网络和价值网络的训练过程中以效率map图的最佳燃油消耗量曲线为基础；

45、b.由式(4)描述的t+k时刻节点i的电动机功率pi(k|t)：

46、

47、式中，ti(k|t)为节点i在时刻t+k的转矩，vi(k|t)为节点i在时刻t+k的速度，ηd表示驱动效率，ηb表示再生制动效率；

48、c.由式(5)描述的电池模型：

49、

50、式中，soc(t)为t时刻的荷电状态，为soc(t)的一阶导数，pb表示电池的输出功率，qb表示电池标称容量，rb表示电池的内阻，voc表示电池的开路电压。

51、进一步地，车辆队列模型中节点i的期望状态xi,r(t)和输入ui,r(t)表示为式(6)：

52、

53、式中，si,r(t)表示节点i的期望位移，vi,r(t)表示节点i的期望车速，ti,r(t)表示节点i的期望驱动、制动转矩，

54、分布式平台多目标优化函数包括式(7)-(11)：

55、

56、

57、

58、

59、j5,i(k|t)＝||wipi(k|t)||2 (11)

60、式中，j1,i(k|t)、j2,i(k|t)分别表示节点之间在时刻t+k的间距误差代价函数；j3,i(k|t)表示节点i在t+k时刻的舒适性代价函数；j4,i(k|t)表示节点i在t+k时刻的稳定性代价函数；j5,i(k|t)表示节点i在t+k时刻的经济性代价函数；qi表示节点i的跟随误差系数矩阵；gi表示节点i假设轨迹的误差系数矩阵；ri表示节点i舒适性系数矩阵；fi表示节点间通信稳定性矩阵；wi表示节点i能耗系数矩阵，上述矩阵均为对称非负定矩阵；表示节点i在t+k时刻的预测控制输出，yi,r(k|t)表示节点i在t+j时刻的期望控制输出，为节点i'在t+k时刻的假定控制输出，为车辆节点之间的距离偏差，表示节点i在t+k时刻的预测控制输入，hi为节点i的行驶阻力方程，由t+k时刻的预测车速决定，为节点i在t+k时刻的假定控制输出，|| ||2为取二范数。

61、本发明还提供一种电子设备，其包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如上所述的多域耦合的能量管理方法。

62、本发明还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行，以用于实现如上所述的多域耦合的能量管理方法。

63、由于本发明利用基于分布式动力单元的多目标奖励函数对基于深度确定性策略梯度算法的能量管理控制器进行训练，得到训练好的能量管理控制器，在实际应用时，直接以分布式动力单元的平台参数为输入，利用训练好的能量管理控制器即可确定分布式动力单元的能量管理策略，从而可在线实时输出能量管理策略，且由于多目标奖励函数的优化目标包括燃油消耗量、电池荷电状态和机组输出功率，故所输出的能量管理策略能够在满足平台性能前提下最小化燃油消耗，并同时实现电池荷电状态维稳和机组输出功率平衡。