技术新讯 > 控制调节装置的制造及其应用技术 > 一种具有自适应能力的电加热烘房能耗控制方法 > 正文

一种具有自适应能力的电加热烘房能耗控制方法

国知局
2024-08-01 00:20:47

：本发明属于人工智能、自动控制领域，涉及一种具有自适应能力的电加热烘房能耗控制方法，通过提升电加热烘房对于干燥物料的自适应性，降低电加热烘房的能耗。

背景技术

0、背景技术：

1、随着社会对节能减排和可持续发展要求的不断提高，电加热烘房作为广泛应用于食品加工、化工产品制造、材料干燥处理的关键设备，其能耗控制技术的研究与改进显得尤为重要。传统的电加热烘房往往采用固定或简单的定时定温控制策略，但在实际运行过程中，由于烘房内工况复杂多变，如物料种类差异、初始湿度、环境温度等因素的影响，可能导致能耗过高，且干燥效果难以达到最优。

2、目前应用于电加热烘房的控制技术包括比例积分微分控制器、专家系统、模糊控制器、神经网络、预测控制等技术。传统比例积分微分控制器不具备自学习和自适应功能，对于干燥物料种类变化、环境条件改变等未预见的因素，无法自动调整控制策略以达到最佳干燥效果和最低能耗。专家系统是一种基于知识和经验的智能控制系统，它模拟人类专家的决策过程来进行控制，其知识库获取难度大，泛化能力不足。模糊控制器、神经网络、预测控制等技术，依赖固定的系统模型，抵抗环境波动能力差，缺乏适应性与鲁棒性，虽能起到一定的优化调控作用，对于干燥物料无法实现自适应，容易导致电加热烘房能耗大于实际干燥物料所需的情况，且不易保证干燥物料成品的质量。

3、综上所述，现有的电加热烘房能耗控制技术存在以下问题：难以精确匹配实际烘干需求，导致能量浪费或烘干不充分；缺乏对电加热烘房内部环境动态变化的快速响应和精准调控能力；对于不同批次和类型的物料，无法自适应调整电加热烘房的工作参数以达到最佳能耗效益比。

4、因此，本发明提出一种具有自适应能力的电加热烘房能耗控制方法。该方法结合现代传感技术、数据处理技术和人工智能算法，能够实时监控电加热烘房内部环境参数，并根据预设的目标函数和强化学习算法机制，动态调整电加热烘房的加热策略，从而实现电加热烘房工作效率和能源利用率的显著提升。这一创新方法将有助于解决现有技术中的能耗控制问题，促进电加热烘房设备向高效、智能、绿色的方向发展。

技术实现思路

0、技术实现要素：

1、本发明提供一种具有自适应能力的电加热烘房能耗控制方法，能有效解决现有电加热烘房自适应能力差，能耗高的问题。本发明提出以长短期记忆网络和深度确定性策略梯度算法为主体的电加热烘房自适应能耗控制框架。首先，使用传感器实时采集电加热烘房内部的环境参数，包括温湿度、风速、电加热器件功率，物料实时含水率的数值，并且对采集的进行数据预处理，贴上相应时间标签。其次，构建长短期记忆网络模型，将预处理之后的历史数据作为输入，预测未来一段时间电加热烘房环境参数的变化趋势。然后，构建深度确定性策略梯度模型，将实时采集的电加热烘房环境参数和预测的环境参数变化趋势共同作为强化学习模型的输入，使用深度确定性策略梯度算法训练具有自适应能力的智能体，并根据电加热烘房的状态，选择当前最具有价值的动作输出。最后，通过比例积分微分控制器，将智能体的动作转换为可执行的具体功率参数，控制电加热设备、除湿风扇进行工作。本发明包含四个步骤，分别是状态采集、建立长短期记忆网络模型、构建深度确定性策略梯度模型、动作执行与反馈。

2、状态采集，所述电加热烘房内部环境参数包括电加热烘房内部的温湿度、风速、物料含水率和电加热设备的实时输出功率，将采集到的烘房内部环境参数进行异常值处理和归一化处理，并给每次采集的环境参数贴上时间标签，以便保持数据之间的时间序列连贯性；

3、建立长短期记忆网络模型，长短期记忆网络模型由输入层、循环层和输出层组成；输入层接收从电加热烘房内部采集并经过处理后的实时环境参数，送入循环层中提取电加热烘房内部环境参数序列数据在时间维度上的依赖关系，输出层将循环层的结果进行非线性变换之后再输出；循环层由多个长短期记忆网络单元组成，每个长短期记忆网络单元内部包括输入门、遗忘门、输出门、以及细胞状态，三个门控机制共同协作，使得长短期记忆网络单元能够选择性地保留重要的历史信息，理解并记忆电加热烘房内部环境参数的变化趋势，输入门为：

4、it＝σ(w(i)xt+u(i)ht-1+b(i)) (1)

5、其中，it表示在第t个时间步输入门的输出值，控制对长短期记忆网络单元的影响程度；σ是sigmoid激活函数，xt是第t个时间步输入序列，ht-1是在第t-1个时间步长短期记忆网络单元的隐藏状态，b(i)为模型的输入偏置；w(i)、u(i)和分别表示xt、ht-1的输入门权重矩阵；遗忘门为：

6、ft＝σ(w(f)xt+u(f)ht-1+b(f)) (2)

7、其中，ft表示在第t个时间步遗忘门的输出值，控制长短期记忆网络单元对长期序列数据中信息的保留和遗忘程度，b(f)为模型的输入偏置；w(f)、u(f)和分别表示xt、ht-1的遗忘门权重矩阵；输出门为：

8、ot＝σ(w(o)xt+u(o)ht-1+b(o)) (4)

9、其中，ot表示在第t个时间步输出门的输出值，控制每个细胞状态内容流向最终隐藏状态ht的比例，b(o)为模型的输入偏置；w(o)、u(o)和分别表示xt、ht-1的输出门权重矩阵，细胞状态候选值为：

10、

11、其中，表示在第t个时间步细胞状态的候选值，这个值经过遗忘门和输入门的共同作用与当前细胞状态结合，生成新的细胞状态ct，tanh是双曲正切函数，b(c)为模型的输入偏置；w(o)、u(o)和分别表示xt、ht-1的输出门权重矩阵；细胞状态的更新公式为：

12、

13、ct表示在第t个时间步的细胞状态，负责在时间序列数据处理过程中保持和传递重要的历史信息，ct-1是前一时间步的细胞状态，ft是遗忘门在时间步t的输出，it是输入门在时间步t的输出，是第t个时间步细胞状态的候选值，⊙表示逐元素法，即对应位置上的两个数相乘；输出为：

14、ht＝ot⊙tanh(ct) (7)

15、ht代表在表示在时间步t的隐藏状态，ot表示在第t个时间步的输出，tanh(ct)表示对当前时间步的细胞状态ct进行双曲正切激活函数非线性变换；

16、构建深度确定性策略梯度模型，深度确定性策略梯度包括actor网络、critic网络、经验回放缓冲区、目标网络、探索策略以及优化算法，其中，经验回放缓冲区存放每个周期的状态信息st、动作信息at、奖励数值rt、下一个状态信息st+1、以及长短期记忆网络预测的电加热烘房环境参数；

17、actor网络是一个神经网络模型，其设计目标是学习一个确定性的策略函数uθ(s)，其中u表示策略，即在给定状态下选择动作a的规则，θ是actor网络的参数集合，需要通过不断学习得到，s是当前环境状态；actor网络更新公式为：

18、

19、uθ(s)是actor网络输出动作的策略，是critic网络对给定的状态-动作对的评价，即q值，ρβ表示在行为策略β下的状态分布，表示在当前策略uθ(s)输出的动作基础上对关于动作a的偏导数，使用一个学习率α更新参数θ，参数θ更新表示为：

20、

21、θ是actor网络的参数集合，α表示学习率，控制每次参数更新的步长，j(θ)表示策略梯度损失函数，表示策略梯度损失函数关于θ的梯度；

22、critic网络也是一个神经网络模型，其目标是学习一个动作值函数它用于估计在状态s下采取动作a后对应的未来累计奖励数值，是critic网络的参数，critic网络更新表示为：

23、

24、(st，at，rt，st+1)是从经验回放缓冲区中采样的一个经验序列，yt是目标q值，贝尔曼方程为：

25、

26、其中，rt是即时奖励，γ是折扣因子，是目标网络对协议状态的q值估计，和θ-分别是critic目标网络和actor目标网络的参数，uθ-(st+1)是actor目标网络在下一状态的输出动作，critic网络参数的更新方式是通过梯度下降最小化损失函数实现，即：

27、

28、其中，表示critic网络当前的所有参数，决定了critic网络的函数形式及其对状态价值的估计能力，α是学习率大小，是损失函数，表示关于参数的梯度，

29、actor网络的输出动作a与一个探索噪声n相加，此处n是服从期望为0，方差为的高斯分布

30、a＝uθ(s)+n (13)

31、奖励函数是电加热烘房环境对智能体在每个时间步对应的状态转换所采取动作的即时反馈，奖励函数的数值用来量化该动作的好坏，引导智能体学习最大化长期累积奖励的策略，奖励函数为：

32、rt＝w1*(et-e)-w2*(d-ot)+w3*qt+w4*(tt+ht)-w5*overt-w6*at (14)

33、rt表示表示奖励函数数值，et表示在第t个单位时间内的能耗，e是期望的能耗水平，w1是该项对应的权重系数；d表示理想干燥速率，ot表示观测到的干燥速率，w2是该项对应的权重系数；qt表示在第t个单位时间内评估干燥物料成品质量得出的分数，w3是该项对应的权重系数；tt表示在第t个单位时间内温度稳定性指标，ht表示在第t个单位时间内湿度稳定性指标，w4是该项对应的权重系数；overt是电加热烘房内温湿度超过安全阈值时数值的绝对值之和，w5是该项对应的权重系数；at是智能体在第t个单位时间内做出大幅度的增加或降低功率决策次数的平方，w6是该项对应的权重系数；

34、动作执行与反馈，根据强化学习训练的智能体给出的决策动作at，使用比例积分微分控制器将动作at转化为可执行的功率数值，从而设定电加热烘房内各个设备的下一阶段运行参数，通过输出端口控制电加热设备和除湿风扇的工作，并且传感器采集下一阶段的电加热烘房内实时环境参数通过输入端口进行反馈。

35、本发明相对于现有技术具有如下的优点及效果：

36、(1)所述的一种具有自适应能力的电加热烘房能耗控制方法的自适应控制策略能够根据物料实时烘干状态动态调整加热功率和时长，避免过度烘干或烘干不足导致的时间浪费，提升生产效率，节省干燥时间；

37、(2)所述的一种具有自适应能力的电加热烘房能耗控制方法通过长短期记忆网络和强化学习能够实现对于干燥物料的自适应，系统能够在保证烘干质量的前提下，合理控制电加热烘房的能耗，实现节能效果。