一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种网格化流水的全收集方法与流程

2022-03-22 20:18:38 来源:中国专利 TAG:


1.本发明涉及一种网格化流水的全收集方法,属于高性能计算机技术领域。


背景技术:

2.高性能计算系统计算资源规模庞大,应用课题同时并发的进程数可能达到数万乃至数十万规模,而因为工艺技术和成本控制等原因,部分高性能计算系统上超节点间的网络通信线路受到裁剪,使得顶层网络带宽受限,存在大规模并发应用的细粒度全收集通信对顶层网络带宽占用过大的问题。
3.鉴于高性能计算系统的上述特点,大规模并行应用在进行细粒度全收集通信中将不可避免地受到由于网络资源受限而引发的通信带宽不足的影响,进而造成大规模并行应用在高性能计算系统上的性能问题。因此,针对高性能计算系统结构特点,研究网格化流水的高性能全收集并发通信优化手段,抑制细粒度通信对顶层网络带宽占用过大的问题,保证大规模并行应用性能,已成为通信优化方法的重点研究方向。
4.现有全收集集合通信技术在含有顶层裁剪的互联网络大规模计算集群中,由于通信粒度过小会造成有限的顶层带宽占用过大的问题,从而造成大规模并行应用性能受限。高性能计算机系统含有顶层裁剪的互联网络,在面临大规模计算应用中全收集集合通信时,存在有限顶层带宽占用过大的问题。


技术实现要素:

5.本发明的目的是提供一种网格化流水的全收集方法,以克服在大规模计算集群中全收集集合通信所面临的通信粒度过小、有限的顶层带宽占用过大的问题,有效提高了全收集集合通信的性能。
6.为达到上述目的,本发明采用的技术方案是:提供一种网格化流水的全收集方法,包括以下步骤:s1、将每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程;s2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二级网格化通信结构,并将二级网格化通信结构映射到大规模集群互联网络结构;s3、在所述二级网格化通信结构上,先在各组内完成数据的收集和共享,再经以下步骤开启全局流水:s31、每个分组的代表进程之间迭代进行环状通信,将一个新的分组的全部数据发送至下一分组;s32、每个分组内的代表进程以二叉树的结构向组内进行流水的广播,形成一个全局同时进行的分级流水通信结构;s33、按照进程规模的不同,经多轮迭代的各组间环状通信和组内广播,完成所述二级网格化通信结构上的全局流水通信。
7.由于上述技术方案的运用,本发明与现有技术相比具有下列优点:
本发明通过将参与通信的进程组织成二级网格化的结构,构建出分级流水,能够合理利用资源,实现全收集集合通信中的通信聚合和顶层网络的带宽节省,有效提高了全收集集合通信的性能,对通信密集型应用具有积极影响。
附图说明
8.附图1为本发明的全局流水通信方法示意图。
具体实施方式
9.实施例:本发明提供一种网格化流水的全收集方法,包括以下步骤:s1、将每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程;s2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二级网格化通信结构,并将二级网格化通信结构映射到大规模集群互联网络结构;s3、在所述二级网格化通信结构上,先在各组内完成数据的收集和共享,再经以下步骤开启全局流水:s31、每个分组的代表进程之间迭代进行环状通信,将一个新的分组的全部数据发送至下一分组;s32、每个分组内的代表进程以二叉树的结构向组内进行流水的广播,形成一个全局同时进行的分级流水通信结构;s33、按照进程规模的不同,经多轮迭代的各组间环状通信和组内广播,完成所述二级网格化通信结构上的全局流水通信。
10.对上述实施例的进一步解释如下:在高性能计算机集群中,将每个超节点内的进程组织为一个分组;每个分组选出任意一个进程作为代表进程,参与到组间的通信中;由此构成二级网格化通信结构并映射到大规模集群的互联网络;结合高性能计算集群硬件架构,通过对通信进程按超节点分组,形成了二级网格化结构,能够合理利用资源,节省顶层网络的带宽;在该二级网格化通信结构上,先在各组内完成数据的收集和共享,然后完成多轮迭代下的各组间环状通信和组内广播同时进行的全局流水;采用流水并发的消息通信模式,实现全收集集合通信中的通信聚合,能够充分改善全收集集合通信性能,对通信密集型应用具有积极影响;本发明方法灵活方便,综合收益大,在现实的高性能应用中具有重要意义。
11.本发明面向大规模计算集群中含有顶层裁剪的互联网络上的全收集集合通信性能问题,通过将参与通信的进程组织成二级网格化的结构,构建出分级流水,从而实现全收集集合通信中的通信聚合和顶层网络的带宽节省。
12.该优化方法主要包含两方面内容:1)二级网格化通信结构的分组方法;2)在二级网格化通信结构上的全局流水通信方法。
13.为达到上述目的,本发明采用的技术方案包括以下步骤:1、每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程。
14.2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二
级网格化通信结构,并将二级网格化通信结构映射到大规模集群互联网络结构。
15.3、在该二级网格化通信结构上,先在各组内完成数据的收集和共享,即组内全收集;再经以下步骤开启全局流水(如图1所示)。
16.4、每个分组的代表进程之间迭代进行环状通信,将一个新的分组的全部数据发送至下一分组。
17.5、同时每个分组内的代表进程以二叉树的结构向组内进行流水的广播,形成一个全局同时进行的分级流水通信结构。
18.6、按照进程规模的不同,经多轮迭代的各组间环状通信和组内广播,完成二级网格化通信结构上的全局流水通信。
19.采用上述一种网格化流水的全收集方法时,其通过将参与通信的进程组织成二级网格化的结构,构建出分级流水,能够合理利用资源,实现全收集集合通信中的通信聚合和顶层网络的带宽节省,有效提高了全收集集合通信的性能,对通信密集型应用具有积极影响。
20.为了便于更好的理解本发明,下面将对本文中使用的术语进行简要的解释:超节点:由大规模高性能计算芯片(节点)集合组成的物理结构。
21.顶层裁剪:超节点之间网络通信线路数量经过缩减。
22.二叉树:树中节点的度不大于2的有序树,是一种最简单且重要的树。
23.全收集:将组中所有进程中的数据聚合到组中每个进程中。
24.广播:从指定的一个根进程中把数据广播发送给组中的所有其它进程。
25.网格化:用于集成或共享资源,使之成为有机整体,共同完成各种所需任务的机制。
26.上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。


技术特征:
1.一种网格化流水的全收集方法,其特征在于,包括以下步骤:s1、将每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程;s2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二级网格化通信结构,并将二级网格化通信结构映射到大规模集群互联网络结构;s3、在所述二级网格化通信结构上,先在各组内完成数据的收集和共享,再经以下步骤开启全局流水:s31、每个分组的代表进程之间迭代进行环状通信,将一个新的分组的全部数据发送至下一分组;s32、每个分组内的代表进程以二叉树的结构向组内进行流水的广播,形成一个全局同时进行的分级流水通信结构;s33、按照进程规模的不同,经多轮迭代的各组间环状通信和组内广播,完成所述二级网格化通信结构上的全局流水通信。

技术总结
本发明公开一种网格化流水的全收集方法,包括以下步骤:S1、将每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程;S2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二级网格化通信结构,并将二级网格化通信结构映射到大规模集群互联网络结构;S3、在所述二级网格化通信结构上,先在各组内完成数据的收集和共享,再开启全局流水。本发明能够合理利用资源,实现全收集集合通信中的通信聚合和顶层网络的带宽节省,有效提高了全收集集合通信的性能,对通信密集型应用具有积极影响。信密集型应用具有积极影响。信密集型应用具有积极影响。


技术研发人员:魏迪 王飞 孙浩男 尹万旺 袁欣辉 林蓉芬 孙强 史俊达
受保护的技术使用者:无锡江南计算技术研究所
技术研发日:2021.04.09
技术公布日:2022/3/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献