一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于仿真策略改进算法的电动汽车充放电调度方法

2022-07-13 16:35:31 来源:中国专利 TAG:


1.本发明涉及电动汽车充放电调度控制领域,具体涉及一种基于仿真策略改进算法的电动汽车充电调度方法。


背景技术:

2.随着环境污染的持续加剧,电动汽车近些年来受到了广泛关注。电动汽车是以车载电源作为其驱动力,具有低污染、节省燃料成本的优点。电动汽车的大量普及可以减少能源消耗,降低尾气排放量,从而达到节能减排的目的。可以预测,未来电动汽车市场将保持强劲的上升势头,并且电动汽车将逐渐实现大规模普及。电动汽车的大规模普及将成为减少化石能源消耗,缓解环境污染的一个重要手段。
3.虽然电动汽车的大规模普及能够降低环境污染,但新出现的大量电动汽车充放电需求将对电网造成较大冲击,如何对电动汽车充放电需求进行合理高效调度控制将是影响电动汽车普及率的关键因素。电动汽车充放电调度控制主要面临如下几个难点。首先,电动汽车充电需求具有随机性。电动汽车充电开始时间、结束时间以及所需充电能量均具有一定不确定性。其次,充放电控制需要考虑多时段影响。由于充电需求的时间耦合性,当前充放电行为将影响未来充电需求,因此需要进行多阶段充放电控制。最后,充放电调度策略空间与电动汽车数量呈指数增长关系。大量电动汽车接入下将带来大状态空间和大行为空间问题,难以高效求解。


技术实现要素:

4.针对电动汽车充放电调度面临的上述难点,本发明将提出一种基于仿真策略改进的电动汽车充放电调度方法,通过蒙特卡洛仿真估计和在线策略改进,结合该问题结构特征,克服该问题面临的不确定需求、多时段决策以及大状态和行为空间难点。
5.实现本发明目的的技术方案为:一种基于仿真策略改进算法的电动汽车充放电调度方法,包括如下步骤:
6.步骤1,获取电动汽车总数量,电动汽车发生停车充电需求的开始时刻服从概率分布,停车时长服从概率分布,所需充电能量服从概率分布;
7.步骤2,建立考虑电动汽车随机充电需求的多阶段充放电调度控制马氏决策模型,确定充放电调度的约束条件;
8.步骤3,采用蒙特卡洛模拟方法对每辆电动汽车仿真生成未来充电需求的多条样本路径;
9.步骤4,根据当前时刻待充电电动汽车状态,删除翻转充放电行为,确定待评估充放电行为集合;
10.步骤5,基于基础策略计算每个充放电行为的q因子;选取具有最大q因子值得行为作为当前最优充放电控制行为,改进当前基础策略性能。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计
算机程序,所述处理器执行所述程序时实现上述的基于仿真策略改进算法的电动汽车充放电调度方法。
12.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的基于仿真策略改进算法的电动汽车充放电调度方法。
13.本发明由于采用以上技术方案,能够取得如下的技术效果:
14.建立的电动汽车充放电调度控制马氏决策模型能够有效表征电动汽车未来不确定充电需求,同时考虑了多时间充放电决策对充放电成本的影响,从而能够提高充放电调度策略对不确定充电需求的适应能力。基于上述马氏决策模型,提出了基于仿真的策略改进算法,结合待评估充放电行为集合筛选,能够有效避免翻转充电情形发生,降低用户不满意度,同时本算法不需要进行迭代优化计算,相比于传统策略迭代、值迭代方法,能够有效解决大状态空间和大行为空间难点,提高求解速度和效率。
附图说明
15.图1是本发明的电动汽车充放电调度方法原理框图。
16.图2是经过充放电调度后的电动汽车充电行为示意图。
具体实施方式
17.下面结合附图和实施例对本发明的技术方案作进一步详述。
18.如图1所示,本发明主要包括:初始化模块、多阶段随机充放电调度模型构建模块、约束条件构建模块、优化目标函数构建模块、样本路径仿真模拟模块、行为集合筛选模块、最优q因子计算模块以及最优充放电调度策略提取输出模块。结合流程图说明具体实现步骤为:
19.步骤1:初始化。通过操作人员输入待充放电调度的电动汽车数量n,电动汽车发生停车充电需求的开始时刻服从概率分布pb,停车时长服从概率分布pd,所需充电能量服从概率分布pe;
20.步骤2:多阶段随机充放电调度模型构建。定义模型状态为其中,表示t时刻第i辆电动汽车的剩余停留时长时间,表示t时刻第i辆电动汽车。定义模型行动为其中,表示t时刻第i辆电动汽车的充放电行为,表示此时对第i辆电动汽车进行充电,表示进行放电,表示不作任何充放电操作。根据电动汽车状态模型中系统的动态方程可以表示为:
21.[0022][0023]
其中,δt表示相邻两次决策时刻之间的时间间隔,表示根据概率分布pd仿真生成的停车时长,p表示充放电功率,ψc表示充电效率,ψd表示放电效率,表示根据概率分布pe仿真生成的所需充电能量。
[0024]
步骤3:约束条件构建。由于需要满足电动汽车的充电需求,同时电动汽车电池物理特性的存在,电动汽车在进行充放电过程中需要满足如下约束条件方程:
[0025][0026][0027][0028]
其中,公式(1)表示电动汽车剩余还需充电能量不能大于电动汽车电池容量e
cap
,公式(2)表示电动汽车剩余还需充电能量不能大于剩余停留时段内所能提供的最大充电能量。公式(3)表示不同条件下电动汽车充放电行为的可行取值范围。
[0029]
步骤4:优化目标函数构建。考虑将电动汽车充电成本最小化作为电动汽车充放电调度优化目标,有如下方程:
[0030][0031]
其中,j表示问题的优化目标值,π表示需要寻优的电动汽车充放电调度策略,t表示决策周期数,ω
t
表示电动汽车充放电电价,e表示期望运算。
[0032]
步骤5:样本路径仿真模拟。对于每辆电动汽车,首先基于电动汽车发生停车充电需求的开始时刻概率分布pb,采样生成未来发生新的停车充电需求事件的开始时间t
next
。其次,基于采样生成的开始时间t
next
和停车时长概率分布pd,采样生成未来新停车充电需求事件的持续时间d
next
。最后,基于所需充电能量概率分布pe,采样生成未来发生新停车充电需求事件的能量需求e
next

[0033]
将三元组[t
next
,d
next
,e
next
]记为第i辆电动汽车未来充电需求的一条样本路径重复上述过程,直至对每辆电动汽车生成共计m条样本路径。
[0034]
步骤6:行为集合筛选。首先对于当前决策时刻t,根据公式(5)确定每辆电动汽车决策行为的可行取值范围。其次,读取每辆电动汽车在t-1时刻决策行动,如果t-1时刻则只能取值0或1。如果则只能取值0或-1。这样能够减少电动汽车频繁翻转充电行为,降低用户不满意度。所有电动汽车的可行决策行为组合在一起形成待评估
充放电行为集合。
[0035]
步骤7:最优q因子计算
[0036]
选取现有电动汽车充放电调度策略作为基础策略πb,例如可以选取如下贪婪充电策略作为基础策略
[0037]
如果
[0038]
对于待评估充放电行为集合中的每一个行为计算每个行为的q因子,如下方程所示。
[0039][0040]
其中,表示根据基础策略πb决定未来每一个时刻每辆电动汽车的充放电行为,表示根据生成的第m条样本路径计算未来充放电成本。
[0041]
选取具有最大q因子的行为a
t
作为当前时刻t的优化行为,同时更新基础策略在t时刻,状态s
t
下的最优行为,如下方程所示:
[0042][0043]
其中,表示待评估充放电行为集合。
[0044]
步骤8:
[0045]
根据公式(9)更新基础策略πb在状态s
t
下的行动,得到电动汽车充放电调度的改进策略,并进行提出输出。
[0046]
本发明的实验结果如图2所示。其中,硬件环境为:cpu i7-11700k@3.60ghz,内存16g,一共对10辆电动汽车充放电过程进行优化调度。图2展示了电动汽车充放电调度结果。其中,图2下半图展示了电动汽车的停车状态,纵坐标为1表示电动汽车处于停车充电状态,纵坐标为0表示电动汽车处于行驶状态。图2上半图展示了电动汽车充放电调度行为,纵坐标为1表示电动汽车此时刻进行充电,纵坐标为-1表示电动汽车此时刻进行放电,纵坐标为0表示电动汽车此时刻不进行任何充放电操作。从图2可以看出,经过调度优化后,电动汽车充电行为主要发生在清晨电价较低时刻,放电行为主要发生在夜晚电价较高时刻,从而能够降低电动汽车充放电成本。
[0047]
本发明的多阶段随机充放电调度模型能够有效表征未来不确定充电需求,解决多阶段充放电联合调度时间耦合难点。在进行模型求解时,通过提出的基于蒙特卡洛模拟的样本路径仿真和策略改进算法,同时结合问题特征筛选可行充放电行为集合,能够解决模型求解过程中面临的大状态空间和大行为空间难点,提高问题求解效率。
[0048]
本发明提供了一种基于仿真策略改进算法的电动汽车充放电调度方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献