技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种面向新能源电力输送的电动汽车用户激励方法、计算机存储介质和程序产品  >  正文

一种面向新能源电力输送的电动汽车用户激励方法、计算机存储介质和程序产品

  • 国知局
  • 2024-08-30 14:24:34

本发明属于新能源电力输送,具体涉及一种面向新能源电力输送的基于深度强化学习的电动汽车用户激励方法,计算机存储介质和程序产品。

背景技术:

1、新能源电力的发展有助于促进环境保护和节能减排。风电和光伏作为最清洁的能源,已在全球范围内实现大规模开发和应用。全球风能理事会(gwec)发布了报告《全球风电报告(2022)》显示,2011年至2021年,全球累计风电装机容量达到837gw,年复合增长率为13.40%。国际能源署(iea)发布了《2022年可再生能源分析与预测至2027年》报告,该报告预测,2022年至2027年间,全球可再生能源装机容量增加近2400gw。

2、由于部署了大规模的新能源收集设备,例如风力涡轮机或太阳能电池板,新能源发电站通常部署在远离城市的郊区。此外,新能源发电具有显著的间歇性、波动性和随机性特征。因此,新能源大规模并网不仅影响城市电网系统的安全稳定运行,而且显著影响城市电网系统运行的经济效益。

技术实现思路

1、针对上述问题,本发明提出一种面向新能源电力输送的电动汽车用户激励方法,目的是提升电动汽车进行新能源电力输送的社会效用、任务完成率和报酬成本比。

2、本发明技术方案如下:一种面向新能源电力输送的电动汽车用户激励方法,包括以下步骤:

3、步骤1、平台发布新能源发电站的电力输送任务信息;

4、步骤2、平台收集报名参与新能源电力输送的电动汽车用户信息;

5、步骤3、以最大化社会效用为目标构建社会优化电动汽车用户选择问题,采用电动汽车用户选择激励算法得到电动汽车用户优胜者集合以及平台支付给优胜者的报酬;

6、所述电动汽车用户选择激励算法包括优胜者选择阶段和报酬确定阶段;

7、所述优胜者选择阶段包括:对于每个新能源发电站,针对每位未被选择的电动汽车用户,采用深度强化学习算法求解一条从电动汽车用户起点到当前新能源发电站且满足能量约束和截止时间约束的第一电动汽车子路径;采用深度强化学习算法求解一条从当前新能源发电站到指定目的地且满足能量约束和截止时间约束的第二电动汽车子路径;第一电动汽车子路径和第二电动汽车子路径集成为一条从电动汽车起点到指定目的地的电动汽车路径;返回得到的所有未被选择的电动汽车用户的电动汽车路径中行驶能耗最低的电动汽车用户为优胜者;

8、所述报酬确定阶段包括:对于每个优胜者,在不包含该优胜者的电动汽车用户集合中执行所述优胜者选择阶段,得到一个新的优胜者用户集合,然后计算当前电动汽车用户不会被新的优胜者用户集合的电动汽车用户所替代的最大报酬。

9、进一步地,在所述优胜者选择阶段,求解得到第一电动汽车子路径后,如果当前电动汽车用户到当前新能源发电站时的可用容量不大于当前新能源发电站待输送的电量时开始下一个未被选择的电动汽车用户的电动汽车路径计算,如果当前电动汽车用户到当前新能源发电站时的可用容量大于当前新能源发电站待输送的电量时求解所述第二电动汽车子路径。

10、进一步地,执行所述步骤3时满足以下约束条件,

11、

12、

13、

14、

15、

16、

17、

18、其中,w为电动汽车用户优胜者集合;be表示电动汽车用户e的输送单位电力的报价;为新能源发电站集合;是一个二元变量,表示电动汽车用户e是否输送新能源发电站f的电力,表示电动汽车用户e是输送新能源发电站f的电力,否则df表示新能源发电站f所储存的电能;qe表示电动汽车路径;|a|表示路段a的长度;γe为电动汽车用户e的单位距离能耗;te表示电动汽车用户e的截止时间;电动汽车用户e的电动汽车经过路段a∈qe后的剩余能量记为为电动汽车用户e的电池容量;表示用户e的电动汽车经过新能源发电站f的剩余电量。

19、进一步地,

20、

21、其中,表示电动汽车用户e的初始电量;表示电动汽车路径qe的经过路段a之前的子路径,表示路径的长度。

22、进一步地,求解第一电动汽车子路径和第二电动汽车子路径时,以电动汽车为智能体形式化为马尔科夫决策过程,马尔科夫决策过程的元素包括:

23、对于每个时间步t,状态向量定义为:ae表示电动汽车用户e的电动汽车所在路段,表示电动汽车用户e的剩余电量,表示电动汽车用户e的剩余截止时间,

24、

25、其中,二元变量ye表示电动汽车用户e的电动汽车是否在指定目的地l处放电,如果放电,ye=1;否则ye=0;αr表示新能源发电站面向电动汽车的充电功率;αd表示电动汽车在指定目的地l处的放电功率;

26、对于每个时间步t,动作向量定义为:二元变量表示用户e的电动汽车是否经过路段a,如果经过,否则

27、奖励定义为:re(se(t),ae(t))=-γe|a|。

28、进一步地,所述最大报酬为其中为新的优胜者用户集合中每个电动汽车用户的成本和,为优胜者用户集合中每个电动汽车用户的成本和,be为当前优胜者用户的输送单位电力的报价,df表示新能源发电站f所储存的电能。

29、进一步地,

30、其中,是一个二元变量,表示电动汽车用户e是否输送新能源发电站f的电力,表示电动汽车用户e是输送新能源发电站f的电力,否则γe为电动汽车用户e的单位距离能耗,|qe|表示电动汽车路径qe的长度,表示新的优胜者用户集合中的电动汽车用户。

31、本发明的另一技术方案为,一种计算机存储介质,其上存储有计算机程序,所述计算机该程序被处理器执行时,实现前述的面向新能源电力输送的电动汽车用户激励方法。

32、本发明的又一技术方案为,一种程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,实现前述的面向新能源电力输送的电动汽车用户激励方法。

33、与现有技术相比,本发明的有益效果是:

34、本发明针对于基于电动汽车的新能源电力输送场景,形式化了社会优化电动汽车用户选择问题,调用电动汽车用户选择激励算法,得到电动汽车用户优胜者集合及其报酬,分别在社会效用、任务完成率和报酬成本比等方面相较于现有技术得到了提升。

技术特征:

1.一种面向新能源电力输送的电动汽车用户激励方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的面向新能源电力输送的电动汽车用户激励方法,其特征在于,在所述优胜者选择阶段,求解得到第一电动汽车子路径后,如果当前电动汽车用户到当前新能源发电站时的可用容量不大于当前新能源发电站待输送的电量时开始下一个未被选择的电动汽车用户的电动汽车路径计算,如果当前电动汽车用户到当前新能源发电站时的可用容量大于当前新能源发电站待输送的电量时求解所述第二电动汽车子路径。

3.根据权利要求1所述的面向新能源电力输送的电动汽车用户激励方法,其特征在于,执行所述步骤3时满足以下约束条件,

4.根据权利要求3所述的面向新能源电力输送的电动汽车用户激励方法,其特征在于,

5.根据权利要求3所述的面向新能源电力输送的电动汽车用户激励方法,其特征在于,求解第一电动汽车子路径和第二电动汽车子路径时,以电动汽车为智能体形式化为马尔科夫决策过程,马尔科夫决策过程的元素包括:

6.根据权利要求1所述的面向新能源电力输送的电动汽车用户激励方法,其特征在于,所述最大报酬为其中为新的优胜者用户集合中每个电动汽车用户的成本和,为优胜者用户集合中每个电动汽车用户的成本和,be为当前优胜者用户的输送单位电力的报价,df表示新能源发电站f所储存的电能。

7.根据权利要求6所述的面向新能源电力输送的电动汽车用户激励方法,其特征在于,

8.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机该程序被处理器执行时,实现权利要求1至7中任意一项所述的面向新能源电力输送的电动汽车用户激励方法。

9.一种程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时,实现权利要求1至7中任意一项所述的面向新能源电力输送的电动汽车用户激励方法。

技术总结本发明公开了一种面向新能源电力输送的电动汽车用户激励方法,形式化了电动汽车调度问题,以最大化所有电动汽车的总剩余电量为目标,确保电动汽车在满足能量约束条件下在截止时间之前到达目的地,基于深度强化学习得到电动汽车路径分配方案;形式化了电动汽车用户社会最优选择问题,基于贪心思想得到社会最优电动汽车用户激励方法。本发明解决大规模新能源电力直接接入电网会对电网系统的安全稳定运行和经济效益产生重大影响的问题,本发明在最大化社会效用和新能源电力输送任务完成率方面显示出优势。技术研发人员:靳勇,杨惠珍,陈政超受保护的技术使用者:常熟理工学院技术研发日:技术公布日:2024/8/27

本文地址:https://www.jishuxx.com/zhuanli/20240830/281856.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。