技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种多核服务器散热控制方法、系统、设备及存储介质  >  正文

一种多核服务器散热控制方法、系统、设备及存储介质

  • 国知局
  • 2025-01-10 13:35:59

本技术涉及散热控制,更具体地说,本技术涉及一种多核服务器散热控制方法、系统、设备及存储介质。

背景技术:

1、散热控制在计算机领域至关重要,其主要目的是在高负荷运行时有效管理和排放热量,以保障设备的性能和寿命,包括风冷、液冷、和热管等,风冷利用散热片和风扇的组合,通过空气对流带走热量,结构简单但在高性能设备中效果有限,液冷系统通过冷却液循环带走热量,具有较好的散热效率,适用于高端设备,热管技术利用液体蒸发和冷凝相变传导热量,随着计算能力的不断提高,散热技术朝向更高效、低噪声和节能的方向发展,如液冷与风冷的混合系统、先进的人工智能算法控制,以及用于极端环境中的冷板技术,这些技术共同作用,为现代计算设备提供了全面的散热解决方案。

2、液冷多核服务器散热控制通过循环冷却液来吸收并传导热量,主要依赖冷却块、泵、冷排和风扇组合实现,冷却液经过冷却块吸收热源热量,通过泵推动流经冷排散热,再循环回冷却块持续冷却,然而,由于液冷多核服务器内部不同中央处理器的功率消耗不同,尤其是在高性能计算任务中,会在液冷多核服务器中某些中央处理器所在区域集中产生过高的热量,从而产生热不对称现象,其中,热不对称现象是指液冷多核服务器内部由于各个中央处理器的热负载不同造成散热不均匀,导致中央处理器所在区域形成局部热点引发热积聚,进一步加剧该区域的温度上升,因此,如何降低热不对称现象对液冷多核服务器散热效果的影响,从而提高冷却系统的效率成为了业界面临的难题。

技术实现思路

1、本技术提供一种多核服务器散热控制方法、系统、设备及存储介质,可降低热不对称现象对液冷多核服务器散热效果的影响,从而提高冷却系统的效率。

2、第一方面,本技术提供一种多核服务器散热控制方法,包括如下步骤:

3、采集目标多核服务器中冷却块的冷却液在不同环境温度下的流动信息;

4、从所有的流动信息中提取出所述冷却液在不同环境温度下的扰流波动特征,根据所有的扰流波动特征和目标多核服务器内各个中央处理器在散热过程中的温度变化趋势确定所述冷却液在不同环境温度下的冷能损失;

5、确定所述冷却块中冷却液进口和冷却液出口之间液体流速的差异熵,根据所述差异熵和所有的冷能损失确定目标多核服务器在散热过程中的冷负荷量;

6、获取所述冷却块与目标多核服务器中各个中央处理器之间的热交换信息,进而根据所有的热交换信息确定所述冷却块和各个中央处理器之间的换热系数,通过所有的换热系数和各个中央处理器的温度梯度确定各个中央处理器在散热过程中的热传递强度;

7、根据所有的热传递强度和所述冷负荷量确定各个中央处理器在散热过程中的冷却代价,基于所有的冷却代价对目标多核服务器中的冷却液进行动态冷却调控。

8、在一些实施例中,从所有的流动信息中提取出所述冷却液在不同环境温度下的扰流波动特征具体包括:

9、根据所有的流动信息确定目标多核服务器中冷却液的进口动态流速区间和出口动态流速区间;

10、对每个流动信息进行差分处理,得到所述冷却液在不同环境温度下的流速波动组;

11、根据所述进口动态流速区间、所述出口动态流速区间和所有的流速波动组确定所述冷却液在不同环境温度下的扰流波动特征。

12、在一些实施例中,根据所有的扰流波动特征和目标多核服务器内各个中央处理器在散热过程中的温度变化趋势确定所述冷却液在不同环境温度下的冷能损失具体包括:

13、对所有的扰流波动特征进行线性拟合,得到扰流波动拟合曲线;

14、根据所述扰流波动拟合曲线确定所述冷却液在不同环境温度下的冷凝换热度;

15、通过所有的冷凝换热度和目标多核服务器内各个中央处理器在散热过程中的温度变化趋势确定所述冷却液在不同环境温度下的冷能损失。

16、在一些实施例中,根据所述差异熵和所有的冷能损失确定目标多核服务器在散热过程中的冷负荷量具体包括:

17、根据预设的滑动窗口和所有的冷能损失确定目标多核服务器在散热过程中的全局冷损失量;

18、根据所述差异熵和所述全局冷损失量确定目标多核服务器在散热过程中的冷负荷量。

19、在一些实施例中,根据所有的热交换信息确定所述冷却块和各个中央处理器之间的换热系数具体包括:

20、根据所有的热交换信息确定所述冷却块和各个中央处理器之间的热扩散特征序列和热边界偏移量;

21、通过所有的热扩散特征序列和所有的热边界偏移量确定所述冷却块和各个中央处理器之间的换热系数。

22、在一些实施例中,通过所有的换热系数和各个中央处理器的温度梯度确定各个中央处理器在散热过程中的热传递强度具体包括:

23、根据所有的换热系数确定目标多核服务器在散热过程中的热衰减度;

24、通过所述热衰减度和各个中央处理器的温度梯度确定各个中央处理器在散热过程中的热传递强度。

25、在一些实施例中,根据所有的热传递强度和所述冷负荷量确定各个中央处理器在散热过程中的冷却代价具体包括:

26、将所有的热传递强度转换成热传递强度序列;

27、根据所述热传递强度序列和所述冷负荷量确定各个中央处理器的散热代价;

28、获取冷却液在不同环境温度下的冷能损失;

29、通过所有的散热代价和冷却液在不同环境温度下的冷能损失确定各个中央处理器在散热过程中的冷却代价。

30、第二方面,本技术提供一种多核服务器散热控制系统,包括:

31、采集模块,用于采集目标多核服务器中冷却块的冷却液在不同环境温度下的流动信息;

32、处理模块,用于从所有的流动信息中提取出所述冷却液在不同环境温度下的扰流波动特征,根据所有的扰流波动特征和目标多核服务器内各个中央处理器在散热过程中的温度变化趋势确定所述冷却液在不同环境温度下的冷能损失;

33、所述处理模块,还用于确定所述冷却块中冷却液进口和冷却液出口之间液体流速的差异熵,根据所述差异熵和所有的冷能损失确定目标多核服务器在散热过程中的冷负荷量;

34、所述处理模块,还用于获取所述冷却块与目标多核服务器中各个中央处理器之间的热交换信息,进而根据所有的热交换信息确定所述冷却块和各个中央处理器之间的换热系数,通过所有的换热系数和各个中央处理器的温度梯度确定各个中央处理器在散热过程中的热传递强度;

35、执行模块,用于根据所有的热传递强度和所述冷负荷量确定各个中央处理器在散热过程中的冷却代价,基于所有的冷却代价对目标多核服务器中的冷却液进行动态冷却调控。

36、第三方面,本技术提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有代码,所述处理器被配置为获取所述代码,并执行上述的多核服务器散热控制方法。

37、第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的多核服务器散热控制方法。

38、本技术公开的实施例提供的技术方案具有以下有益效果:

39、本技术提供的多核服务器散热控制方法、系统、设备及存储介质中,首先采集目标多核服务器中冷却块的冷却液在不同环境温度下的流动信息;从所有的流动信息中提取出所述冷却液在不同环境温度下的扰流波动特征,根据所有的扰流波动特征和目标多核服务器内各个中央处理器在散热过程中的温度变化趋势确定所述冷却液在不同环境温度下的冷能损失;确定所述冷却块中冷却液进口和冷却液出口之间液体流速的差异熵,根据所述差异熵和所有的冷能损失确定目标多核服务器在散热过程中的冷负荷量;获取所述冷却块与目标多核服务器中各个中央处理器之间的热交换信息,进而根据所有的热交换信息确定所述冷却块和各个中央处理器之间的换热系数,通过所有的换热系数和各个中央处理器的温度梯度确定各个中央处理器在散热过程中的热传递强度;根据所有的热传递强度和所述冷负荷量确定各个中央处理器在散热过程中的冷却代价,基于所有的冷却代价对目标多核服务器中的冷却液进行动态冷却调控。

40、由此可见,本技术中可以根据所有的热传递强度和所述冷负荷量确定各个中央处理器在散热过程中的冷却代价;其中,首先,从所有的流动信息中提取出所述冷却液在不同环境温度下的扰流波动特征,通过扰流波动特征可以帮助实时调整冷却液在多核服务器中的流动路径和流量分配,确保高热负载区域得到足够的冷却,同时避免低热负载区域的过度冷却,进而对所有的扰流波动特征进行拟合,并对拟合得到的结果与多核服务器内各个中央处理器在散热过程中的温度变化趋势进行量化,得到冷却液在不同环境温度下的冷能损失,其中

41、所述冷能损失表示冷却系统中的冷却液通过中央处理器时消耗的能量中未能有效减少中央处理器热负荷所损失的能量,通过减少冷能损失,可以提高冷却系统的整体性能,确保冷却液能有效地带走处理器产生的热量,其次,使用冷却液进口和冷却液出口之间液体流速的差异熵从所有的冷能损失中提取出用于衡量液冷系统在冷却多核服务器内各个中央处理器时由于热不对称现象导致额外积累的总热量,冷负荷量有助于评估和优化冷却系统的能力,以应对热不对称现象,通过有效的冷却控制,可以减少局部热点的形成,避免由于热积聚导致的温度过高,然后,确定冷却块和各个中央处理器之间的换热系数,其中,换热系数反映了中央处理器处的冷却块的散热效率,再对所有的换热系数和各个中央处理器的温度梯度进行量化,得到衡量中央处理器在散热过程中热量传递的热传递强度,再次,从所有的热传递强度中提取出各个中央处理器在散热过程中的冷却代价,其中,散热代价是指多核服务器在不同环境温度下,为实现有效散热所需投入的能量和资源,包括冷却液的能耗、流量调节开销,以及散热过程中克服系统热不对称现象所需的额外代价,通过冷却代价可以识别出需要额外关注的热不对称区域,从而通过技术手段减少局部过热,进而通过所有的散热代价和冷却液在不同环境温度下的冷能损失确定各个中央处理器在散热过程中的冷却代价,其中,所述冷却代价是指在不同的环境温度下使得多核服务器中各个中央处理器达到最佳冷却效果所需要付出的代价,通过所述冷却代价可评估各个中央处理器的冷却需求,动态调整冷却液的流量和分布,从而有效减少热不对称现象对整体散热效果的影响,最后,基于所有的冷却代价对目标多核服务器中的冷却液进行动态冷却调控;综上所述,本技术的方案可降低热不对称现象对液冷多核服务器散热效果的影响,从而提高冷却系统的效率。

本文地址:https://www.jishuxx.com/zhuanli/20250110/354139.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。