技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种地下矿盘区回采作业调度方法、装置和电子设备 > 正文

一种地下矿盘区回采作业调度方法、装置和电子设备

国知局
2024-07-31 23:24:57

本发明涉及地下矿山生产调度，尤其涉及一种地下矿盘区回采作业调度方法、装置和电子设备。

背景技术：

1、地下矿山的开采工序集凿岩、爆破、支护、铲装、运输和充填为一体，是个多业务接续与协调的复杂庞大系统。矿山生产调度的核心职能是发挥枢纽与指挥功能，将有限的人员、装备等资源科学、合理地安排到适宜的工作面，使各项交替作业有序顺畅进行。矿山作业装备的调度优化是提高回采作业效率的最有效方法。

2、国外学者对装备调度优化模型已有部分研究，其中包括对中长期生产计划优化、短期生产计划优化、运输装备调配优化和运输成本优化，采用的方法包括数学规划法和计算机模拟法。随着群智能优化理论和算法的发展，出现了使用遗传算法、粒子群算法和蚁群算法进行模型解算的研究，有效提高了模型解算效率，但主要还是集中在露天矿的生产调度研究领域，对地下矿盘区回采作业装备调度优化问题研究较少。

3、随着科学技术不断发展，地下矿山作业装备逐渐向小型化、集群化发展，且地下矿山生产规模也在不断增大，导致了盘区内回采作业装备数量会逐渐增加，因此，需要如何有效调度回采作业装备，提高回采装备利用率。同时，随着新能源汽车电池技术发展日趋成熟，井下生产也会逐渐引入蓄电池式作业装备，如何更加有效利用蓄电池式电动装备，从而减少地下矿回采作业所产生的能耗，也是未来一个重要的研究方向。

技术实现思路

1、有鉴于此，有必要提供一种地下矿盘区回采作业调度方法、装置和电子设备，用以解决现有技术中对于地下矿盘区回采作业装备多且集群化，而缺乏地下矿盘区回采作业的调度优化手段的技术问题。

2、为了解决上述问题，本发明提供一种地下矿盘区回采作业调度方法，包括：

3、基于回采作业计划，根据地下矿盘区内的多个采场、多种工序和不同的作业装备，以回采任务完成时间最短及计划期内装备生产总能耗最低为优化目标，构建多目标混合整数规划模型；

4、将所述多目标混合整体规划模型转化为多智能体马尔科夫决策过程，获得目标调度模型；

5、采用预设深度强化学习对所述目标调度模型进行求解，得到多个所述采场对应的多种工序的起止时间，以及对应的作业装备的编号。

6、在一种可能的实现方式中，多目标混合整数规划模型的约束条件至少包括：

7、在同一个采场的多种工序下，后一步工序的开始时间晚于前一步工序的结束时间；

8、在同一个采场的同一个工序下，仅允许一台作业设备进行作业；

9、在同一个采场的相邻两个工序下，后一步工序的开始时间晚于前一步工序的结束时间加设备的转移时间；

10、回采作业开始时刻，所有回采作业装备均可用。

11、在一种可能的实现方式中，将所述多目标混合整体规划模型转化为多智能体马尔科夫决策过程，获得目标调度模型，包括：

12、将多目标混合整体规划模型中的作业装备视为智能体；

13、基于所述智能体，确定多智能体马尔科夫决策过程中的状态空间、动作空间以及奖励函数。

14、在一种可能的实现方式中，多智能体马尔科夫决策过程中的动作空间为基于采场作业时间和装备运行时间的调度规则，所述动作空间至少包括：

15、选择装备转移时间与作业时间之和与装备能耗之比最小的工序；

16、选择等待时间最久的工序；

17、选择下一次转移时间与作业时间之和与装备能耗之比最大的工序；

18、选择作业时间与总工时之比最小的工序；

19、选择剩余时间最长的工序；

20、选择剩余时间最短的工序；

21、选择作业时间与总工时之积最大的工序；

22、选择当前工序外的剩余时间最小的工序。

23、在一种可能的实现方式中，多智能体马尔科夫决策过程中的状态空间为作业装备对应的智能体在不同时间的作业场景信息，具体包括状态矩阵、装备作业矩阵、工序作业时间矩阵、装备转移时间矩阵和装备能耗矩阵。

24、在一种可能的实现方式中，所述获得目标调度模型包括：

25、基于动作空间输出的动作，作业装备智能体根据预设对应的调度规则确定被调度的工序；

26、根据所述被调度的工序，确定实时的奖励函数。

27、在一种可能的实现方式中，采用预设深度强化学习对所述目标调度模型进行求解，包括：

28、s1、初始化环境对象，根据回采作业计划和多目标混合整数规划模型的约束条件对各个环境状态矩阵赋初值，初始化装备智能体参数；

29、s2、在当前调度时刻，以所有采场对应的工序和装备的工作状态构成目标调度模型的当前状态，根据环境状态矩阵，确定当前可调度的采场和装备；

30、s3、基于设定的调度规则，根据当前状态以及当前可调度的采场和装备，智能体为调度动作分配优先级，并确定最高优先级的调度动作；

31、s4、确定要开展生产作业的采场与工序、生产作业装备和作业开始时间进行状态转移，返回新状态并反馈奖励信息和作业完成情况；

32、s5、若回采作业全部完成，智能体执行求解完成后的步骤；反之，返回s2回采执行。

33、第二方面，本发明还提供一种地下矿盘区回采作业调度装置，包括：

34、模型构建模块，用于基于回采作业计划，根据地下矿盘区内的多个采场、多种工序和不同的作业装备，以回采任务完成时间最短及计划期内装备生产总能耗最低为优化目标，构建多目标混合整数规划模型；

35、目标模型确定模块，用于将所述多目标混合整体规划模型转化为多智能体马尔科夫决策过程，获得目标调度模型；

36、调度求解模块，用于采用预设深度强化学习对所述目标调度模型进行求解，得到多个所述采场对应的多种工序的起止时间，以及对应的作业装备的编号。

37、第三方面，本发明还提供了一种电子设备，包括：处理器和存储器；

38、所述存储器上存储有可被所述处理器执行的计算机可读程序；

39、所述处理器执行所述计算机可读程序时实现如上所述的地下矿盘区回采作业调度方法中的步骤。

40、第四方面，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如上所述的地下矿盘区回采作业调度方法中的步骤。

41、本发明的有益效果是：首先基于回采作业计划，根据地下矿盘区内的多个采场、多种工序和不同的作业装备，以回采任务完成时间最短及计划期内装备生产总能耗最低为优化目标，构建多目标混合整数规划模型；通过确保回采任务的完成时间最短，可以提高矿山的生产效率，并且完成时间最短的作业计划有助于缩短生产周期，从而提高矿山的灵活性和应变能力。随后将所述多目标混合整体规划模型转化为多智能体马尔科夫决策过程，获得目标调度模型；并采用预设深度强化学习对所述目标调度模型进行求解，得到多个所述采场对应的多种工序的起止时间，以及对应的作业装备的编号。本发明将多目标混合整数规划模型转化为多智能体马尔科夫决策过程并采用预设深度强化学习进行求解，可以更好的适应的地下矿盘区的动态环境和不确定性，并且能够根据实时信息和环境反馈做出决策，从而更有效地实现回采任务完成时间最短和装备生产总能耗最低的优化目标。