技术新讯 > 电子通信装置的制造及其应用技术 > 基于任务的异构CPU-GPU片上网络路由方法、装置、系统及介质与流程  >  正文

基于任务的异构CPU-GPU片上网络路由方法、装置、系统及介质与流程

  • 国知局
  • 2024-10-15 10:04:31

本技术涉及芯片设计,例如一种基于任务的异构cpu-gpu片上网络路由方法、装置、系统及介质。

背景技术:

1、目前,随着生产生活中各类任务的计算需求不断增加,异构多核芯片应运而生,以解决传统同构多核cpu算力不足的问题。其中cpu-gpu的异构组合最为常见,cpu和gpu通过共享末级缓存(llc)、内存控制器(mc)及其他片上资源以减少通信开销,提高系统性能。

2、然而,资源共享势必带来资源竞争问题,gpu的多线程结构对延迟不敏感,而其高吞吐量会显著加剧资源共享带来的问题。在此背景下,使用片上网络(noc)连接各个模块,分离网络中的不同流量成为实现共享资源的合理分配的重要解决方案。

3、cpu-gpu llc/mc共包含四种节点:cpu、gpu、llc及mc。基于布局位置的不同衍生出了多种拓扑模型,图1展示了本技术针对的中心布局模式,该模式下相同类型节点分布相对集聚。该模型着重考虑了cpu和gpu的内存访问任务,llc和mc分布在拓扑中心区域,被cpu和gpu包围起来。mc被llc包围,只与llc通信以减少跳数,该设计方案可以最小化cpu和gpu频繁访问llc时的路由跳数。但该布局方式会导致部分路径面临巨大的数据运载压力,即产生拥塞路径,即图中加粗标记的数据路径。此外,llc和mc频繁通信会导致中心部分出现信息热点区域,即图中虚线框出的部分,热点部分更易出现信息阻塞等问题。在热点区域中,各个llc以及各个mc之间没有直接通信,因此图中热点区域中竖直路径上的流量会小于水平路径上的流量。此外,在外围的cpu和gpu部分,其环路上的流量也相对较小。

技术实现思路

1、为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。

2、本公开实施例提供了一种基于任务的异构cpu-gpu片上网络路由方法、装置、系统及介质,以解决现有cpu-gpu异构片上网络架构中心布局模式中的阻塞问题。

3、在一些实施例中,所述方法包括:

4、s01)、设定路由方法的路径选择规则,路径选择规则的优先级从a至d逐级递减:

5、a.执行任务路由跳数尽可能少;

6、b.分配到的高流量路径尽可能少;

7、c.尽快离开热点区域;

8、d.网络内工作负载尽可能平衡;

9、s02)、执行缓存访问请求任务时,即由cpu/gpu访问llc时,依据规则b,采用xy路由方法,优先经过外围环路路径和热点区域竖直路径;

10、s03)、执行cpu请求回复任务时,即由llc回复cpu时,依据规则b,采用yx路由方法,优先通过竖直路径离开热点区域;

11、s04)、执行gpu请求回复任务时,即由llc回复gpu时,依据规则d,采用xy路由方法,尽快离开热点区域进入低流量压力的环路区域。

12、进一步的,设src为源节点,dst为目的节点,src.x、dst.x分别为源节点、目的节点的水平坐标,src.y、dst.y分别为源节点、目的节点的竖直坐标,xy路由方法为:先比较src.x与dst.x的值,如果src.x>dst.x,则向左直行路由,反之向右直行,直至src.x=dst.x,随后判断src.y与dst.y的关系,如果src.y>dst.y,则向下直行路由,反之则向上直行,直至抵达目的节点。

13、进一步的,设src为源节点,dst为目的节点,src.x、dst.x分别为源节点、目的节点的水平坐标,src.y、dst.y分别为源节点、目的节点的竖直坐标,yx路由方法为:先比较src.y与dst.y的值,如果src.y>dst.y,则向下直行路由,反之向上直行,直至src.y=dst.y,随后判断src.x与dst.x的关系,如果src.x>dst.x,则向左直行路由,反之则向右直行,直至抵达目的节点。

14、进一步的,本方法在每个路由器输入端口设有两个虚拟通道vc1和vc2,虚拟通道vc1用于通过所有基于任务的xy路由路径,虚拟通道vc2用于通过所有基于任务的yx路由路径,路由器输出端口设有交叉开关,每个路由器输入端口的虚拟通道连接至交叉开关,由交叉开关产生避免死锁的输出。

15、进一步的,路由器输出端还设有路由计算模块、虚拟通道仲裁器和交叉开关仲裁器,路由计算模块调度数据输出端口的选择,即确认用于输出数据的端口,虚拟通道仲裁器决定离开虚拟通道传递到交叉开关的虚拟通道数据,交叉开关仲裁器管理交叉开关输入和输出的匹配;交叉开关产生的不同输出具有不同的物理数据链路。

16、在一些实施例中,所述装置包括:路由路径选择规则确定模块,用于确定如下四条路径选择规则,并且路径选择规则的优先级从a至d逐级递减:

17、a.执行任务路由跳数尽可能少;

18、b.分配到的高流量路径尽可能少;

19、c.尽快离开热点区域;

20、d.网络内工作负载尽可能平衡;

21、缓存访问请求任务路由路径确定模块,执行缓存访问请求任务时,即由cpu/gpu访问llc时,依据规则b,采用xy路由方法,优先经过外围环路路径和热点区域竖直路径;

22、cpu请求回复任务路由路径确定模块,执行cpu请求回复任务时,即由llc回复cpu时,依据规则b,采用yx路由方法;

23、gpu请求回复任务路由路径确定模块,执行gpu请求回复任务时,即由llc回复gpu时,依据规则d,采用xy路由方法。

24、进一步的,在每个路由器输入端口设有两个虚拟通道vc1和vc2,虚拟通道vc1用于通过所有基于任务的xy路由路径,虚拟通道vc2用于通过所有基于任务的yx路由路径,路由器输出端口设有交叉开关,每个路由器输入端口的虚拟通道末端连接至交叉开关,由交叉开关产生避免死锁的输出。

25、进一步的,路由器输出端还设有路由计算模块、虚拟通道仲裁器和交叉开关仲裁器,路由计算模块调度数据输出端口的选择,即确认用于输出数据的端口,虚拟通道仲裁器决定离开虚拟通道传递到交叉开关的虚拟通道数据,交叉开关仲裁器管理交叉开关输入和输出的匹配。

26、在一些实施例中,所述系统包括:处理器和存储有程序指令的存储器,所述处理器被配置为在运行所述程序指令时,执行如上所述的基于任务的异构cpu-gpu片上网络路由方法。

27、在一些实施例中,所述存储介质存储有程序指令,所述程序指令在运行时,执行如上所述的基于任务的异构cpu-gpu片上网络路由方法。

28、本发明的有益效果:本方案针对异构片上网络,中心布局的llc/mc拓扑模型存在的数据热点和网络拥塞问题提出了解决方案。与传统路由算法相比,本方案的算法有着更低的网络延迟,更高的整体性能。同时基于任务的虚拟通道可以避免死锁问题的出现,进一步提高了网络表现。

29、以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本技术。

本文地址:https://www.jishuxx.com/zhuanli/20241015/316347.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。