空调控制方法、装置、介质及设备与流程
- 国知局
- 2024-10-15 10:07:04
本公开涉及空调控制,尤其涉及一种空调控制方法、装置、介质及设备。
背景技术:
1、相关技术中,空调对温度调节的舒适性和节能性是目前评价空调性能优劣的两个重要指标。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供一种空调控制方法、装置、介质及设备。
2、根据本公开实施例的第一方面,提供一种空调控制方法,包括:
3、将目标空调的运行状态输入至控制模型,得到目标动作序列;
4、根据所述目标动作序列,控制所述目标空调;
5、其中,所述控制模型的训练包括:
6、将样本运行状态输入至所述控制模型,得到决策动作;
7、将所述样本运行状态和所述决策动作输入预设的状态预测网络,得到预测运行状态;
8、将所述预测运行状态作为新的样本运行状态输入至所述控制模型中,对所述控制模型进行训练。
9、可选地,所述控制模型的训练还包括:
10、根据所述预测运行状态,确定针对所述决策动作的目标奖励值;
11、多次更新所述控制模型的网络参数,并执行所述将样本运行状态输入至所述控制模型,得到决策动作的步骤,得到每次更新后的控制模型输出的决策动作,并确定每一所述决策动作对应的目标奖励值;
12、根据多个所述目标奖励值,得到所述控制模型。
13、可选地,根据所述预测运行状态,确定针对所述决策动作的目标奖励值,包括:
14、将所述预测运行状态输入至预设的空调能耗模型和预设的舒适度模型中,得到所述预测运行状态对应的空调能耗指标和舒适度指标;
15、根据所述空调能耗指标和所述舒适度指标,确定针对所述决策动作的目标奖励值。
16、可选地,所述预测运行状态至少包括压缩机运行频率、风机转速和空间内温度;
17、将所述预测运行状态输入至预设的空调能耗模型和预设的舒适度模型中,得到所述预测运行状态对应的空调能耗指标和舒适度指标,包括:
18、至少将所述压缩机运行频率和所述风机转速输入至预设的空调能耗模型中,得到所述空调能耗指标;
19、至少将所述空间内温度输入至预设的舒适度模型中,得到所述舒适度指标。
20、可选地,所述决策动作为连续的多个决策动作,相应的,所述预测运行状态为多个,且一决策动作对应一预测运行状态;
21、根据所述预测运行状态,确定针对所述决策动作的目标奖励值,包括:
22、根据所述多个预测运行状态,确定针对所述多个决策动作的奖励值;
23、根据多个所述奖励值的累计和,确定所述目标奖励值。
24、可选地,所述控制模型包括决策网络和评价网络,所述决策网络用于根据所述样本运行状态输出所述决策动作,所述评价网络用于根据所述预测运行状态,确定针对所述决策动作的奖励值;迭代更新所述控制模型的网络参数,包括:
25、利用不同的参数更新方法分别更新所述决策网络的网络参数和所述评价网络的网络参数。
26、可选地,所述状态预测网络采用长短期记忆网络lstm。
27、根据本公开实施例的第二方面,提供一种空调控制装置,包括:
28、获得模块,被配置为将目标空调的运行状态输入至控制模型,得到目标动作序列;
29、控制模块,被配置为根据所述目标动作序列,控制所述目标空调;
30、其中,所述控制模型的训练包括:
31、将样本运行状态输入至所述控制模型,得到决策动作;
32、将所述样本运行状态和所述决策动作输入预设的状态预测网络,得到预测运行状态;
33、将所述预测运行状态作为新的样本运行状态输入至所述控制模型中,对所述控制模型进行训练。
34、根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面提供的空调控制方法。
35、根据本公开实施例的第四方面,提供一种设备,包括:
36、存储装置,用于存储计算机程序;
37、执行装置,用于执行所述计算机程序,以实现本公开第一方面提供的空调控制方法。
38、本公开的实施例提供的技术方案可以包括以下有益效果:
39、本公开通过预设的状态预测网络根据样本运行状态和控制模型输出的决策动作,得到预测运行状态,预测运行状态可以作为新的样本运行状态,对控制模型进行训练。这样,通过预设的状态预测网络,能够根据有限的样本数据生成更多的样本数据,从而增加了可用于训练的样本数据量,减轻因样本数据不足而导致的过拟合问题。并且,将预测的运行状态作为新的样本输入到控制模型中进行训练,可以帮助控制模型更好地捕捉空调的运行模式和规律,提高了控制模型的泛化能力,使得控制模型输出的动作序列更符合空调的实际需求。
40、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
技术特征:1.一种空调控制方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述控制模型的训练还包括:
3.根据权利要求2所述的方法,其特征在于,根据所述预测运行状态,确定针对所述决策动作的目标奖励值,包括:
4.根据权利要求3所述的方法,其特征在于,所述预测运行状态至少包括压缩机运行频率、风机转速和空间内温度;
5.根据权利要求2所述的方法,其特征在于,所述决策动作为连续的多个决策动作,相应的,所述预测运行状态为多个,且一决策动作对应一预测运行状态;
6.根据权利要求2所述的方法,其特征在于,所述控制模型包括决策网络和评价网络,所述决策网络用于根据所述样本运行状态输出所述决策动作,所述评价网络用于根据所述预测运行状态,确定针对所述决策动作的奖励值;迭代更新所述控制模型的网络参数,包括:
7.根据权利要求1-6任一所述的方法,其特征在于,所述状态预测网络采用长短期记忆网络lstm。
8.一种空调控制装置,其特征在于,包括:
9.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1-7中任一所述的空调控制方法。
10.一种设备,其特征在于,包括:
技术总结本公开提供一种空调控制方法、装置、介质及设备,涉及空调控制技术领域,包括:将目标空调的运行状态输入至控制模型,得到目标动作序列;根据目标动作序列,控制目标空调。本公开通过预设的状态预测网络,能够根据有限的样本数据生成更多的样本数据,从而增加了可用于训练的样本数据量,减轻因样本数据不足而导致的过拟合问题。并且,将预测的运行状态作为新的样本输入到控制模型中进行训练,可以帮助控制模型更好地捕捉空调的运行模式和规律,提高了控制模型的泛化能力,使得控制模型输出的动作序列更符合空调的实际需求。技术研发人员:张杰,潘城城,陈渊受保护的技术使用者:小米科技(武汉)有限公司技术研发日:技术公布日:2024/10/10本文地址:https://www.jishuxx.com/zhuanli/20241015/316482.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表