一种多处理器系统及数据传输方法与流程
- 国知局
- 2024-11-21 11:50:09
本技术涉及数据传输技术,特别涉及一种多处理器系统及数据传输方法。
背景技术:
1、在目前的各类智能系统中,往往涉及到多个处理器之间的数据传输和消费,其中,处理器例如可以是中央处理器(cpu)、图形处理器(gpu)或神经网络处理器(npu)等。不同处理器之间通常包括多个路径,由此在多个处理器的多个路径间的数据传输需要保证数据同步和保序。
2、目前对于多处理器的多路径数据传输,为保证数据同步和保序,通常在源处理器本地写入需要传输的目标数据,然后本地写入与该目标数据对应的同步信号,接下来再进行下一笔数据及其同步信号的本地写入;目的处理器远程轮询保存在源处理器的同步信号,当轮询到目标数据所对应的同步信号后,确定相应目标数据已经准备好,远程读取保存在源处理器的相应数据。上述数据传输方式中,目的处理器的远程轮询处理速度慢,延时长,效率低,因此使得整个数据传输的性能比较差。
技术实现思路
1、本技术提供一种多处理器系统及数据传输方法,能够在保证同步保序的同时,有效提高处理速度,降低延时。
2、为实现上述目的,本技术采用如下技术方案:
3、一种多处理器之间的数据传输方法,包括:
4、源处理器的运算单元将需要传输的目标数据,通过所述源处理器中与目的处理器连接的所有第一端口单元写入到所述目的处理器,通过各个所述第一端口单元将第一屏障原子请求分别发送到各个第二端口单元;其中,所述第二端口单元为与所述第一端口单元连接的、位于所述目的处理器上的端口单元;
5、所述目的处理器中的每个第二端口单元,接收所述第一屏障原子请求,并在确定所述第一屏障原子请求对应的关联数据都成功写入后,向聚合单元发送所述第一屏障原子请求;
6、所述聚合单元接收到所有所述第二端口单元发送的所述第一屏障原子请求后,向所述目的处理器的存储单元发送与所述目标数据对应的第一原子信息;
7、所述目的处理器在本地轮询到所述第一原子信息后,确定所述目标数据完成传输。
8、较佳地,所述目标数据包括一个或多个目标数据包;
9、所述方法进一步包括:将用于请求将任一目标数据包写入所述目的处理器的写请求,通过各个所述第一端口单元传输到与各所述第一端口单元连接的所述第二端口单元,所述第二端口单元对所述关联数据的写请求进行计数,得到当前计数结果,并在接收到所述第一屏障原子请求后,将所述当前计数结果与所述第一屏障原子请求对应的目的地址建立对应关系;所述第二端口单元在接收到本端口单元接收的写请求对应的第一确认指令后,对所述写请求对应的当前计数结果减1,作为新的当前计数结果。
10、较佳地,确定所述第一屏障原子请求对应的关联数据都成功写入的方式包括:
11、当所述第一屏障原子请求所对应的目的地址对应的当前计数结果减少到0时,确定所述第一屏障原子请求对应的关联数据都成功写入。
12、较佳地,确定所述聚合单元接收到所有所述第二端口单元发送的所述第一屏障原子请求的方式包括:
13、所述聚合单元在每次接收到所述第一屏障原子请求时,确定所述第一屏障原子请求对应的目的地址,并对已接收的该目的地址所对应的第一屏障原子请求的数目进行计数,当计数数量达到所述源处理器和所述目的处理器之间的路径总数时,确定所述agg单元接收到所有所述第二端口单元发送的所述第一屏障原子请求。
14、较佳地,所述方法进一步包括:预先在所述第二端口单元中设置若干表项;
15、在所述关联数据的写请求首次进行计数时,所述方法进一步包括:设置所述当前计数结果对应于当前表项;
16、所述将所述当前计数结果与所述第一屏障原子请求对应的目的地址建立对应关系,包括:确定当前表项,并将所述当前表项对应于所述第一屏障原子请求对应的目的地址;
17、其中,所述当前表项为:所述第二端口单元在当前任务中首次接收到写请求后,或者,在接收到所述第一屏障原子请求且将所述当前计数结果与所述第一屏障原子请求对应的目的地址建立对应关系后,选择出的一个当前未使用的表项。
18、较佳地,所述第二端口单元在确定所述第一屏障原子请求对应目的地址对应的当前计数结果减少到0后,所述方法进一步包括:释放该当前计数结果对应的表项,将该表项作为未使用的表项。
19、较佳地,该方法进一步包括:将所述第一原子信息保存在所述存储单元中所述第一屏障原子请求对应的目的地址上;
20、确定所述目的处理器在本地轮询到所述第一原子信息的方式包括:
21、所述目的处理器在本地轮询用于保存原子信息的地址空间,当所述第一屏障原子请求对应的目的地址上的信息表征目标数据已经成功收到时,确定轮询到所述第一原子信息。
22、一种多处理器系统,包括:源处理器和目的处理器;所述源处理器包括多个运算单元和多个第一端口单元,所述目的处理器包括多个第二端口单元、聚合单元、存储单元和轮询单元;所述第一端口单元和所述第二端口单元一一对应连接;
23、所述源处理器中的运算单元,用于将需要发送的目标数据通过所有第一端口单元写入到目的处理器,通过各个所述第一端口单元将第一屏障原子请求分别发送到各个第二端口单元;
24、所述源处理器中的第一端口单元,用于向相连的所述第二端口单元转发所述目标数据和所述第一屏障原子请求;
25、所述目的处理器中的每个第二端口单元,用于接收所述第一屏障原子请求,并在确定所述第一屏障原子请求对应的关联数据都成功写入后,向所述聚合单元发送所述第一屏障原子请求;
26、所述聚合单元,用于在接收到所有所述第二端口单元发送的所述第一屏障原子请求后,向所述存储单元发送与所述目标数据对应的第一原子信息;
27、所述存储单元,用于保存所述目标数据和所述第一原子信息;
28、所述轮询单元,用于在所述存储单元中轮询到所述第一原子信息后,确定所述目标数据完成传输。
29、较佳地,所述目标数据包括一个或多个目标数据包;
30、所述运算单元,进一步用于将用于请求将任一目标数据包写入所述目的处理器的写请求,通过各个所述第一端口单元传输到与各所述第一端口单元连接的第二端口单元;
31、所述第二端口单元,进一步用于对所述关联数据的写请求进行计数,得到当前计数结果,并在接收到所述第一屏障原子请求后,将所述当前计数结果与所述第一屏障原子请求对应的目的地址建立对应关系;所述第二端口单元在接收到本端口单元接收的写请求对应的第一确认指令后,对所述写请求对应的当前计数结果减1,作为新的当前计数结果。
32、较佳地,在所述第二端口单元中,确定所述第一屏障原子请求对应的关联数据都成功写入的方式包括:
33、当所述第一屏障原子请求所对应的目的地址对应的当前计数结果减少到0时,确定所述第一屏障原子请求对应的关联数据都成功写入。
34、较佳地,在所述聚合单元中,确定所述聚合单元接收到所有所述第二端口单元发送的所述第一屏障原子请求的方式包括:
35、所述聚合单元在每次接收到所述第一屏障原子请求时,确定所述第一屏障原子请求对应的目的地址,并对已接收的该目的地址所对应的第一屏障原子请求的数目进行计数,当计数数量达到所述源处理器和所述目的处理器之间的路径总数时,确定所述agg单元接收到所有所述第二端口单元发送的所述第一屏障原子请求。
36、较佳地,每个所述第二端口单元,进一步用于设置表项,还用于在所述关联数据的写请求首次进行计数时,设置所述当前计数结果对应于当前表项;
37、其中,所述将所述当前计数结果与所述第一屏障原子请求对应的目的地址建立对应关系,包括:确定当前表项,并将所述当前表项对应于所述第一屏障原子请求对应的目的地址;所述当前表项为:所述第二端口单元在当前任务中首次接收到写请求后,或者,在接收到所述第一屏障原子请求且将所述当前计数结果与所述第一屏障原子请求对应的目的地址建立对应关系后,选择出的一个当前未使用的表项。
38、较佳地,每个所述第二端口单元,进一步用于在确定所述第一屏障原子请求对应目的地址对应的当前计数结果减少到0后,释放该当前计数结果对应的表项,将该表项作为未使用的表项。
39、较佳地,所述聚合单元,还用于将所述第一原子信息保存在所述存储单元中所述第一屏障原子请求对应的目的地址上;
40、在所述轮询单元中,确定在所述存储单元中轮询到所述第一原子信息的方式包括:
41、在所述存储单元中轮询用于保存原子信息的地址空间,当轮询到与所述第一屏障原子请求对应的目的地址上的信息表征目标数据已经成功收到时,确定轮询到所述第一原子信息。
42、由上述技术方案可见,本技术中,源处理器的运算单元(cu)将需要传输的目标数据,通过源处理器中与目的处理器连接的所有端口单元(以下称为第一端口单元)写入到目的处理器,并通过各个第一端口单元将第一屏障(fence)原子(atomic)请求发送到目的处理器上与第一端口单元连接的各个第二端口单元。在目的处理器上,每个第二端口单元接收第一fence atomic请求,并在确定与该请求对应的关联数据都成功写入后,向聚合(agg)单元发送第一fence atomic请求;由此,第二端口单元可以通知agg单元通过本端口单元传输的数据已成功;接下来,agg单元在收集到所有第二端口单元发送的第一fence atomic请求后,能够确认通过所有第二端口发来的关联数据都已写入成功,也就说明目标数据都已写入成功,则agg单元向hbm写入与目标数据对应的第一atomic信息,用于表示目标数据已准备好;目的处理器通过本地轮询找到第一原子信息后可以确定目标数据已准备好。通过上述处理,可以将需要传输的数据保存到目的处理器,并通过各个第二端口单元与agg单元的配合,保证在目标数据写入成功后再写入与数据对应的atomic信息,用于作为目的处理器本地轮询的依据,以实现数据传输的同步和保序,且目标数据直接远程写入目的处理器,atomic信息的轮询在目的处理器本地进行,因此极大地提高了轮询速度、降低了处理延时,进而有效提高整个数据传输的性能。
本文地址:https://www.jishuxx.com/zhuanli/20241120/332958.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表