一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

现场可编程逻辑门阵列的制作方法

2022-12-20 22:45:06 来源:中国专利 TAG:


1.本发明总地涉及现场可编程逻辑门阵列(fpga)的领域。


背景技术:

2.现场可编程逻辑门阵列是一种半定制电路,被设计为在制造之后可编程的半导体设备。典型的现场可编程逻辑门阵列通常包含可编程逻辑块(clb),或称可配置逻辑块,每个clb可通过可编程互连结构选择性地连接到其他clb,这使现场可编程逻辑门阵列变得非常强大和灵活。与专用集成电路(asic)相比,现场可编程逻辑门阵列的设计周期更短,通过使用硬件描述语言(hdl),可以更快和更高效地进行设计和编程,并减少制造时间;hdl包括但不限于verilog hdl、vhdl,system verilog和system c。与微控制器相比,现场可编程逻辑门阵列具有更大的灵活性,并且具有很高的处理速度。
3.可编程逻辑块提供了现场可编程逻辑门阵列的功能,这些逻辑块通过可编程布线线网相互连接,可编程布线线网被配置为布线连接至可编程逻辑块和i/o块,以实现任何用户定义的电路。现场可编程逻辑门阵列中的布线架构包括传统的岛型(island-style)现场可编程逻辑门阵列和层次式(hierarchical)现场可编程逻辑门阵列。在岛型现场可编程逻辑门阵列架构中,管芯包含垂直和水平的布线,占管芯总空间的80%以上,其余的10-20%的区域为clb占用。岛型现场可编程逻辑门阵列布线的主要特征是以二维网格样式排列clb,至于布线线网资源则均匀分布。层次式现场可编程逻辑门阵列是一种基于多层次方法布线架构,其特征在于将逻辑资源分层和分组地管理,布线资源细分为低层次的局部互连线和高层次的全局互连线,层次式的布线架构可提高电路速度并减小布线所占的面积。
4.由于现场可编程逻辑门阵列管芯尺寸较大,且功耗较高,为了克服缺点,架构上需要有不同的改进,尤其是异构分段(heterogeneous segmented)现场可编程逻辑门阵列,结构上是由细粒度逻辑单元或可编程布线元件和可编程分段布线组成。由于可编程布线元件阵列之间的连接是预定义的并且在制造后是不变的,因此在设计现场可编程逻辑门阵列的布线架构时,应考虑最坏情况下的布线线网拥塞,以确保可以在现场可编程逻辑门阵列中实现任何电路设计。因此,管芯面积的大部分都用于布线线网构造,特别是用于处理连接逻辑块和分段布线线网之间的连接块,以及缝合分段布线线网以提供更长距离的分段路由和改变方向的交换块。显然,管芯面积是集成电路设计中的主要成本因素之一,它会影响生产良率和制造成本,在单个晶片中,管芯尺寸越小,可以制造的芯片越多,可以找到的缺陷单元就越少。当实现各种现场可编程逻辑门阵列的布线架构时,许多布线线网资源都会是空闲的。
5.因此,本领域中需要一种可以最小化管芯尺寸并更有效地利用布线线网资源的布线架构,该架构在不降低可布线性的情况下,改善布线线网结构的电源效率。


技术实现要素:

6.本文提供了一种现场可编程逻辑门阵列。本发明的目的是提供一种可以最小化管
芯尺寸并更有效地利用布线线网资源的布线架构,该布线架构尤其是用于异构分段现场可编程逻辑门阵列以更有效地利用布线线网资源,改善布线线网结构的电源效率。
7.现场可编程逻辑门阵列包括:多个可编程单元块,其排成行和列以形成阵列,其中,每个可编程单元块包括可编程区块、一个或多个交换块和一个或多个连接块,每个可编程区块可被编程以操作和执行逻辑功能或布线功能;以及布线线网,其包括分段路由和直接路由。这些连接块被配置为从四个基本方向扇入分段路由和直接路由,接收扇入信号,并耦合到可编程区块。至于交换块则被配置为驱动并发送扇出信号到分段路由上。每个基本方向中的分段路由中的一个分段路由通过专用电路直接连接到交换块,以驱动该交换块向该四个基本方向输出长距离输出,从而允许发送扇出信号到基本输出方向,该基本输出方向包括接收该扇入信号的扇入方向。
8.根据一个实施例,交换块包括多个输出多路复用器,每个输出多路复用器上具有五个输入边沿,分别连接到该可编程区块的输出和该四个基本方向各自的分段路由中的一个分段路由,每个输出多路复用器向一个基本输出方向输出长距离输出。
9.优选地,每个输出多路复用器的五个输入边沿中的一个接收的分段路由来自于一基本方向,该基本方向与该每个输出多路复用器的长距离输出的基本输出方向相同。
10.优选地,该交换块包括多个长距离驱动器,其中,每个长距离驱动器被配置为向该四个基本方向各自的分段路由中的一个基本方向驱动并发送该扇出信号。
11.根据一个实施例,该连接块包括多个输入多路复用器,该多个输入多路复用器被配置为只直接从其中一半的该分段路由接收该扇入信号,并向该可编程区块提供输入多路复用。
12.根据一个实施例,该每个基本方向中的分段路由的一个分段路由为距离该可编程区块最远的源或最远的目的地。
13.根据一个实施例,该扇入信号和该扇出信号分别经源扇入和目的地扇出,其中,该源和该目的地为距离该可编程区块最近的相邻源和相邻目的地。
14.根据一个实施例,该扇入信号和该扇出信号分别经源扇入和目的地扇出,其中,该源和该目的地向该四个基本方向延伸,并交替接驳至交替行和交替列。
15.优选地,该源和该目的地按x方向和y方向延伸,并完全对称。
16.优选地,该源和该目的地只接驳到单数的行和单数的列。
17.根据一个实施例,该扇入信号或该扇出信号能够分别扇入或扇出到没有直接接驳的交替行或没有直接接驳的交替列。该每个可编程单元块在相邻方向上直接接驳到相邻可编程单元块;该相邻可编程单元块可以从该相邻方向接收并发送该扇入信号或该扇出信号,从而于该相邻可编程单元块进行u型转弯,并扇入或扇出到该没有直接接驳的交替行或该没有直接接驳的交替列。
18.优选地,该相邻可编程单元块直接接驳到距离该可编程区块最远的源和最远的目的地,以进行该u型转弯。
19.优选地,该可编程区块具有可配置为逻辑功能或布线功能的架构。
20.优选地,该可编程区块包括具有可选逻辑模式的n个输入查找表,其特征在于,n个输入查找表可被配置以支持执行n输入逻辑功能,或配置为路由多路复用器,配合本地驱动器来支持执行该逻辑功能。
21.优选地,该多个可编程单元块包括分段混合逻辑布线单元块,其中,该分段混合逻辑布线单元块使用一个以上分段的分段垂直布线或分段水平布线。
22.优选地,该现场可编程逻辑门阵列使用多于一个管芯堆叠来实现。
23.优选地,该现场可编程逻辑门阵列在独立管芯中实现,或以知识产权块嵌入在集成电路中。
24.本发明为了减少管芯面积和功耗,在输出多路复用器上增加了一个新的输入边沿,这使分段路由可以发送扇出信号回到其扇入的基本方向。因此,通过在相反方向上利用分段路由的连接,可以降低输入多路复用器的输入边沿的数量,从而减小了输入多路复用器的大小。同样,由于分段路由的扇出数量较小,因此可以利用更高的功率效率和更小的长距离驱动器,节省管芯面积而不会有损性能。
25.通过分段路由到分段路由跃迁,去除从分段路由到可编程区块的直接输入来缩小连接块的尺寸。然而,交换块中分段路由之间的路由选项增加了,以更有效地利用连接块中的其余连接,保留路由选择可能性的组合。与交换块的尺寸增益相比,从连接块减小的尺寸更为显著。因此,可以减小现场可编程逻辑门阵列的总管芯面积。
26.提供本发明内容以简化形式介绍一些概念,这些概念将在下面的详细描述中进一步描述。本发明内容既不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。如下文的实施例所示,公开了本发明的其他方面和优点。
附图说明
27.随附的附图包含进一步示出和阐明本发明的以上和其他方面、优点和特征的附图。应当意识到,这些附图仅描绘了本发明的某些实施例,而无意于限制其范围。技术人员应当理解,这些附图是为了简单和清楚而示出的,并不一定按比例绘制。现将通过使用附图以附加的特征和细节来描述和解释本发明,其中:
28.图1描绘了现场可编程逻辑门阵列的一个实施例的框图;
29.图2描绘了异构分段现场可编程逻辑门阵列的一个实施例的框图;
30.图3描绘了异构分段现场可编程逻辑门阵列中shlrt的一种原始实施方案的电路图;
31.图4描绘了根据本发明的具有u型转弯布线的shlrt的一个实施例的电路图;
32.图5描绘了根据图4的shlrt的异构输入的电路图;
33.图6描绘了根据图4的shlrt的输出多路复用器的电路图;
34.图7描绘了根据本发明的异构分段现场可编程逻辑门阵列的扇出图的示例;以及
35.图8描绘了以两个根据图7的扇出图来接驳没有长距离目的地的行。
具体实施方式
36.本文中描述的示例涉及现场可编程逻辑门阵列,具体而言,涉及一种具有u型转弯布线的现场可编程逻辑门阵列。更具体地但非限制性地,本发明提供了一种可以最小化管芯尺寸并更有效地利用布线线网资源的现场可编程逻辑门阵列布线架构,该布线架构能够改善布线线网结构的电源效率,而不影响可布线性。
37.以下的详细描述本质上仅是示例性的,无意于限制本发明或其应用和/或用途。应当理解,存在大量的变型。详细的描述将使本领域普通技术人员能够实现本发明的示例性实施例而不必进行不必要的实验,并且应当理解,在不脱离本发明的范围的情况下,可以对示例性实施例中描述的功能和结构进行各种改变或改进。
38.益处、优点、问题的解决方案以及可使任何益处、优点或解决方案出现或变得更加明显的任何要素均不应被解释为本发明的技术方案的关键、必需或必要的特征或要素。
39.本公开中描述这些示例和其他实施例,可以在独立管芯中实现。其他示例可以使用多于一个管芯堆叠来实现,或以知识产权块嵌入在集成电路中,各种模式皆可以根据本文中描述的示例来实现。如本领域普通技术人员在阅读本公开之后将容易理解的,通过各种示例可以实现附加或其他益处。
40.除非另有定义,本发明实施例中所使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。如本文所使用的术语“水平的”和“垂直的”彼此相对并且相对于附图和说明书中遵循的惯例,并不表示物理上在芯片(或管芯)的任何一个特定方向。类似地,如本文中所使用的术语“上方”、“下方”、“左侧”、“右侧”、“垂直”、“水平”、“东”、“南”、“西”、“北”和其他方向性术语,彼此相对并且相对于附图和说明书中遵循的惯例,并不表示物理上在芯片(或管芯)的任何一个特定方向。还应注意,术语“列”和“行”用于指定相对于本文附图的方向,并且在一个实施例中的“列”可以在另一实施例中是“行”。
41.当在本文使用时,“混合逻辑布线单元块”或“hlrt”是“hybrid logic or routing tiles”的缩写,是现场可编程逻辑门阵列中的一种可编程单元块,在一个实施例中,多个hlrt排成行和列的阵列。另一方面,当一个或多个交换块耦合到多个hlrt,扩展细粒度逻辑或布线可编程元件,以进行分段布线,例如,使用一个以上分段的分段垂直布线或使用一个以上分段的分段水平布线,可形成一种新型的可编程单元块,在本文中称为“分段混合逻辑布线单元块”或“shlrt”,“shlrt”是“segmented hybrid logic or routing tiles”的缩写。
42.当在本文使用时,“混合逻辑或布线功能”或“hlr”是“hybrid logic or routing function”的缩写,指的是可编程区块中一个可配置为逻辑功能或布线功能的架构。
43.现场可编程逻辑门阵列的主要部分是多个可编程单元块排成行和列的阵列,其中,每个可编程单元块包括一个逻辑块和相邻的布线线网,因此,每个逻辑块和相邻的布线线网被实现为一个单元。在本文附图描绘的,是单个“可编程单元块”的布局,而在芯片中可包括一个或多个根据本发明的可编程单元块,亦可配合其他可编程单元块的架构而不脱离本公开的范围和精神。
44.在一个实施例中,相邻的可编程单元块(hlrt或shlrt)经由直接路由直接连接。也就是说,hlrt和shlrt没有分段路由地连接在一起,只有用直接驱动路径来连接比较短的距离。在一个实施例中,一个或更多个可编程单元块被配置为布线功能并用作布线集线器。在一个实施例中,其中一个或更多个可编程单元块被配置为逻辑功能,该逻辑功能使用被编程为多路复用器的查找表结构来实现。在一个实施例中,为了将配置为逻辑功能的可编程单元块与芯片外部端口连接,可以使用配置为布线功能的可编程单元块,使得外部端口直接连接至配置为逻辑功能的可编程单元块,从而,外部端口的信号可以通过由配置为布线
功能的多个可编程单元块形成的直接连接进行传输。
45.图1示出了现场可编程逻辑门阵列架构的一个实施例,其中,所述现场可编程逻辑门阵列具有一个或多个hlrt 100阵列,按行和列排列,每个hlrt 100包括具有hlr 101的可编程区块以及连接块102。在一个实施例中,每个hlr 101可配置为逻辑功能或布线功能,连接块102耦合到每个可编程区块以提供输入多路复用。虽然在图1中示出了两个连接块102,但是在某些实施例中,可以具有一个或不止两个的连接块102,其将hlr101与直接路由连接。更详细地,hlr 101包括逻辑块111,其具有可选逻辑模式(例如,n个输入查找表),以支持任何n输入逻辑功能,或者相同的逻辑块111可以通过相应地编程查找表的内容,而配置为路由多路复用器(mux)112a,配合驱动器112b,来支持布线功能和扩展。
46.例如,在一种配置中,为了针对具有n个输入的逻辑功能,使用查找表结构来实现hlr 101中的逻辑块。可以将相同的查找表结构编程为静态的n对1多路复用器112a,以便hlr 101可以用作在分段路由之间跳转的路由跃点,类似于典型的现场可编程逻辑门阵列架构中的交换块功能。
47.在一个实施例中,连接块102为输入多路复用器120,配置为将直接路由252连接到hlr 101以提供直接路由252输入的多路复用,并且输出到由hlr 101提供的逻辑功能或布线功能。虽然图1仅显示一个输入多路复用器120,显然,每个连接块102上可能有不止一个的输入多路复用器120,而每个输入多路复用器120可能是m对1多路复用器。
48.以上架构提供了快速的逻辑到逻辑连接,有效地缩减关键路径的长度,并且更适合用于在独立芯片中实现较小的可编程阵列或嵌入在不同管芯中,因为典型的网不需要长距离传输。当需要更大的可编程阵列时,此架构的布线灵活性可能有限,无法同时在同一个可编程单元块中支持直接路由252和分段路由的跨接连接。
49.图2示出了图1中所示的直接驱动布线架构的扩展,在一个实施例中,可编程逻辑架构结合了用于驱动分段路由的分段路由和用于驱动直接路由的直接路由,这种异构分段布线架构具有一个额外的交换块204,以提供长距离之间的路由跃点。在某些实施例中,异构分段布线架构可具有两个或多个交换块204。此架构应用了一种新型的hlrt,在本文中被称为shlrt。现场可编程逻辑门阵列中有一个布线线网,布线线网中有直接路由252和分段路由251两种布线通道,其中,在同一个可编程单元块中的相应hlr 201可用于实现其他逻辑或直接路由252功能。在一个实施例中,该长距离专用的交换块204还提供比通过hlr 201连接更快的布线连接,从而以与可编程逻辑架构相同的方式同时实现高性能和长距离布线连接,分段路由仍然可以直接通过连接块202到达hlr 201,并且输出仍可以通过新的交换块204实现分段路由。
50.参照图2,异构分段现场可编程逻辑门阵列具有分段路由251,直接路由252,以及多个的shlrt 200的可编程门架构,按行和列排列以形成阵列,每个shlrt 200包括多个具有逻辑功能或布线功能的hlr 201、交换块204以及连接块202。在shlrt 200的hlr 201是以图1描述的hlr101相似的方式操作,是一种可编程区块,可被编程以操作和执行逻辑功能或布线功能,在某些实施例中,可编程区块可执行一次编程或在不同时间执行多次编程。其中,每个hlr 201包括逻辑块211,其具有可选逻辑模式(例如,n个输入查找表)以支持执行任何n输入逻辑功能,或者相同的逻辑块211可以通过相应地编程查找表的内容,而配置为路由多路复用器212a,配合本地驱动器212b,来支持执行布线功能和扩展的布线功能。
51.在一个实施例中,分段路由251是沿垂直或水平方向连接到每个hlr201,从而把多个shlrt 200连接上。连接块202为输入多路复用器220,被配置为从分段路由251和直接路由252接收扇入信号,并耦合到hlr201,向hlr 201提供输入多路复用,并且输出到由hlr 201提供的逻辑功能或布线功能,而没有如现有技术中典型的分段布线架构中那样对布线线网资源进行输出复用。在该实施例中,连接块202中的任何一个的输入多路复用器220具有两个或更多个输入以及一个输出,其中,两个或更多个输入是与分段路由251的迹线和直接路由252的迹线连接,一个输出直接连接到hlr 201的逻辑功能或布线功能的输入253。
52.虽然在图2中示出了两个连接块202,显然,在不脱离本公开的范围和精神的情况下,hlr 201可以连接到多于或少于两个的连接块202,并与不同数目的分段路由251的迹线和直接路由252的迹线连接。经连接块202扇入和经交换块204扇出的源和目的地,亦可根据分段路由251的数量而调节。扇入信号可以是直接路由252信号或沿垂直或水平方向连接到分段路由251信号。
53.在一个实施例中,shlrt 200的交换块204被配置与hlr 201和多条分段路由251相连。交换块204包括多个输出多路复用器244和多个长距离驱动器245,每个输出多路复用器244具有两个或更多个输入,可以按迹线设计和需要,让一个输入连接到hlr 201的输出254,而另一个输入连接到其他分段路由251以进行分段路由251到分段路由251的跃迁。而输出多路复用器244的输出则连接到长距离驱动器245,并向长距离驱动器245生成输出,而该长距离驱动器245配置为驱动并发送扇出信号到分段路由251上。在图示的实施例中,仅示出了一个输出多路复用器244和一个长距离驱动器245以避免使本发明难以理解。
54.图3示出了异构分段现场可编程逻辑门阵列中shlrt 200的一种原始实施方案的电路图,在这方案,具有100个异构直接路由252或分段路由251的连接,根据本方案的扇入安排,源最远可达19个水平距离和19个垂直距离,扇入图的细节将在图7中讨论。其中,所述异构直接路由252或分段路由251来自100个不同的源位置,包括24个直接路由252和76个分段路由251,经四个输入多路复用器迹线耦合到hlr 201。另外,hlr201被配置为四个输入查找表(lut4)311。显然,在不脱离本公开的范围和精神的情况下,hlr 201可被配置为不同数量输入的查找表(例如五个输入查找表和六个输入查找表),而源位置、直接路由和分段路由的数量亦可不同。
55.根据一个实施例,在源位置和查找表311的输入之间放置了四个25位输入多路复用器(25:1mux)320,尤其是,第一个输入多路复用器320的输出耦接至所述查找表311中的第一输入端口,相似地,第二个至第四个输入多路复用器320的输出则分别耦接至所述查找表311中的第二至第四输入端口。查找表输出(lut_out)311a直接驱动相应的24个直接路由252和本地驱动器312,另外,查找表输出311a也连接到四个4对1输出多路复用器344和长距离驱动器345以提供专用的分段路由资源,驱动长距离目的地,以便最多可以连接并连接到四个不同的长距离目的地,同时,hlr 201的查找表311仍可以驱动不同的直接路由252。
56.在某些实施例中,shlrt具有不同数量的直接路由252和分段路由251的连接,可平均分布或非平均分布地连接多个输入多路复用器320,其中,输入多路复用器320可具有不同位数的输入。现场可编程逻辑门阵列的布线线网结构是以分段路由251连接到排成行和列的逻辑块,因此分段路由251线网是从每个逻辑块的上方、下方、左侧或右侧扇入,在本公开中,为方便理解,分段路由251扇入的方向是定义为从四个基本方向扇入,即shlrt的“东”,“南”,“西”和“北”面,以上方向的定义亦同样适用于基本输出方向。在图示的实施例中,每个基本方向扇入的分段路由有19个,但从同一基本方向扇入的分段路由不一定只耦接至同一个输入多路复用器320,而每个基本方向中的分段路由的一个分段路由251,优选shlrt中距离最远的源(即每个基本方向第19个源),除了连接到输入多路复用器320,还通过专用电路342直接连接到输出多路复用器344的输入,因此,每个输出多路复用器344具有一个从查找表311的输入,和三个从分段路由251的输入,其中,由于每个输出多路复用器344配置为驱动一个输出方向的长距离目的地,三个从分段路由251的输入是从不同于所述输出方向的三个基本输出方向扇入的分段路由,并达致缓冲的效果。如图中所示,交换块204包括四个输出多路复用器244和四个长距离驱动器245,驱动并发送扇出信号到四个基本输出方向的分段路由251上。
57.以上这种安排是在以下假设下进行的:分段路由251的连接是不会返回扇入的基本方向,而是继续连接到其他三个基本方向的。例如,来自北面的分段路由可以通过专用电路342直接连接并耦接至东面,南面或西面的输出,不用经过hlr 201,快速连接并可选择直线的向前连接或向左右转变方向。相似地,来自东面、南面和西面的分段路由亦可以通过专用电路342直接连接并耦接至每个各自其他三个基本方向的输出。此实施方案的效果可实现如图2所示的交换块204,进行分段路由到分段路由的跃迁。
58.根据如上所述的原始shlrt布线架构,分段路由251分段连接到每个通过的逻辑块211,以最大程度地提高布线灵活性。尽管此架构提供了较高的布线能力,但由于来自传入连接的大量分段路由251的输入,输入多路复用器320的面积很大。此外,由于那些分段的扇出度高,因此必须增加长距离驱动器345的驱动强度以保持时序性能。这也导致更大的管芯面积和更多的功耗。
59.为了减少管芯面积和功耗,如图4所示出的电路图,本发明描述了一种具有u型转弯布线的shlrt 400。在异构分段现场可编程逻辑门阵列的架构中,现场可编程逻辑门阵列包括多个可编程单元块排成行和列,其中,多个可编程单元块中至少一个是shlrt 400,而shlrt 400包括可编程区块、交换块204和连接块202;可编程区块可被编程以操作和执行逻辑功能或布线功能,在一个实施例中,可编程区块是图2描述的hlr 201,包括具有可选逻辑模式的n个输入查找表411,以支持执行任何n输入逻辑功能,或者相同的查找表411可以通过相应地编程查找表411的内容,而配置为路由多路复用器,配合本地驱动器412和长距离驱动器445来支持执行逻辑功能和布线功能和扩展的布线功能。其中,连接块202包括多个输入多路复用器420,被配置为从四个基本方向扇入分段路由251和直接路由252,接收扇入信号,并耦合到hlr 201,向hlr 201提供输入多路复用,并且输出到由查找表411提供的逻辑功能或布线功能。在一个实施例中,异构分段现场可编程逻辑门阵列还可能有其他单元块,包括但不限于输入块、输出块、随机存取存储器块、数字信号处理块、定时逻辑、以及其他可编程逻辑等,为了简单和清晰而示出以方便理解,其他单元块未在图中示出。
60.有利地,输入多路复用器420不需要从所有分段路由251接收扇入信号,反而,在两个shlrt 400之间的分段路由251,输入多路复用器420只直接从其中一半的分段路由251接收扇入信号,而相邻的shlrt 400的输入多路复用器420会直接从另一半的分段路由251接收扇入信号。因此,当需要从一条没有直接连接的分段路由251迹线接收扇入信号时,可经相邻的shlrt 400以本发明的u型转弯布线连接。
61.在一个实施例中,交换块204包括多个输出多路复用器444和多个长距离驱动器445,每个长距离驱动器445被配置为驱动并发送扇出信号到一个基本方向的分段路由251上。有利的是,每个输出多路复用器444具有五个输入边沿,分别连接到hlr 201的输出,即查找表输出(lut_out)411a,和四个基本方向各自的分段路由中的一个分段路由251以进行分段路由251到分段路由251跃迁。每个基本方向中的分段路由中的一个分段路由251,优选所述基本方向距离可编程区块最远的源(即每个基本方向第10个源),通过专用电路442直接连接到所述交换块204,由于每个输出多路复用器444从四个基本方向接收到分段路由251信号并各自驱动一个基本输出方向的分段路由251,以驱动所述四个基本输出方向的长距离输出,所以允许发送扇出信号到每个基本方向,尤其是包括回到接收所述扇入信号的扇入方向。换句话说,当输出多路复用器444从扇入方向接收扇入信号,本发明允许向该扇入方向输出扇出信号。
62.在一个实施例中,输出多路复用器444是一个五位输出多路复用器(5:1mux),具有一个附加输入路由443以接收与长距离输出方向相同的扇入信号,如图4和图5所示,对于驱动北面的分段路由251(l_n_out),shlrt 400包括一个北面的附加输入路由443a,允许北面其中一个分段路由251(l_n_in_9)发送扇出信号回到北面的分段路由251。相似地,对于驱动东面的分段路由251(l_e_out),shlrt 400包括一个东面的附加输入路由443c,允许东面其中一个分段路由251(l_e_in_9)发送扇出信号回到东面的分段路由251。南面和西面的分段路由251亦分别可经南面的附加输入路由443b和西面的附加输入路由443d,允许南面和西面的其中一个分段路由251(l_s_in_9,l_w_in_9)发送扇出信号回到南面和西面的分段路由251。通过在相反方向上利用分段的连接,输入的数量可以有利地减少到64,包括24个直接路由252和40个分段路由251,每个输入多路复用器420的输入边沿的数量为16。相比于图3所示的原始实施方案中以25位输入多路复用器(25:1mux)320耦接100个直接输入,本发明是用16位输入多路复用器(16:1mux)420。虽然输出多路复用器444增加了一个输入,面积会有所提高,但与输入多路复用器420中缩小的大小相比,输出多路复用器444的增加可以忽略不计。因此,本发明对于管芯面积有着明显的进步,shlrt的面积变得更小,功耗亦可得到降低。经连接块202扇入的源和经交换块204扇出的目的地,比分段路由251的数量少了大概一半。
63.具有u型转弯布线的shlrt 400可连接上不同数量的直接路由252和分段路由251,其中,直接路由252和分段路由251可平均分布或非平均分布地连接多个输入多路复用器420,图5详细地示出了一种布线分布安排。扇入信号可以是直接路由252信号或沿垂直或水平方向从四个基本方向连接到的分段路由251信号。如前所述,输入多路复用器420具较少位数的输入,在这例子中,每个输入多路复用器420有16位输入。分段路由251是从四个基本方向扇入的分段路由,每个基本方向扇入的分段路由251有10个,但从同一基本方向扇入的分段路由251不一定只耦接至同一个输入多路复用器420,作为一种更可取的方法,四个基本方向扇入的分段路由251平均分布地连接至输入多路复用器420,例如,第一组直接路由252a和第一组分段路由251a耦接至第一个输入多路复用器420a,其中,第一组分段路由251a包括从四个基本方向扇入的分段路由,由中心(0)至外围(9),分别依序接至东、西、北和南面;第二组直接路由252b和第二组分段路由251b耦接至第二个输入多路复用器420b,第二组分段路由251b由中心(0)至外围(9),分别依序接至西、北、南和东面;第三组直接路
由252c和第三组分段路由251c耦接至第三个输入多路复用器420c,第三组分段路由251c由中心(0)至外围(9),分别依序接至北、南、东和西面;第四组直接路由252d和第四组分段路由251d耦接至第四个输入多路复用器420d,第四组分段路由251d由中心(0)至外围(9),分别依序接至南、东、西和北面。
64.在一个实施例中,每个基本方向中其中一个分段路由251,优选shlrt400距离可编程区块最远的源(即每个基本方向第10个),除了連接到输入多路复用器420,还通过专用电路442直接连接到交换块204,通过附加输入路由443连接到输出多路复用器444的输入。因此,每个输出多路复用器344具有一个从查找表411的输入,和四个从分段路由251的输入。
65.其中,由于每个输出多路复用器444上增加了一个输入边沿,可以从四个基本方向接收分段路由251的扇入信号,并配置为驱动该四个基本方向各自的分段路由中的一个基本方向的长距离目的地,提供输出多路复用,达致缓冲的效果。如图6所示,交换块204包括四个输出多路复用器444和四个长距离驱动器445,驱动并发送扇出信号到四个基本输出方向的分段路由251上。北向输出多路复用器444n的输入包括经北面的附加输入路由443a输入的北面距离最远的源251n(l_n_in_9),还有另外三个基本方向距离最远的源251s/251e/251w和查找表输出(lut_out)411a,对北面的长距离驱动器445n提供输出多路复用,以驱动北面的分段路由446n(l_n_out)。南向输出多路复用器444s的输入包括经南面的附加输入路由443b输入的南面距离最远的源251s(l_s_in_9),还有另外三个基本方向距离最远的源251n/251e/251w和查找表输出(lut_out)411a,对南面的长距离驱动器445s提供输出多路复用,以驱动南面的分段路由446s(l_s_out)。东向输出多路复用器444e的输入包括经东面的附加输入路由443c输入的东面距离最远的源251e(l_e_in_9),还有另外三个基本方向距离最远的源251n/251s/251w和查找表输出(lut_out)411a,对东面的长距离驱动器445e提供输出多路复用,以驱动东面的分段路由446e(l_e_out)。西向输出多路复用器444w的输入包括经西面的附加输入路由443d输入的西面距离最远的源251w(l_w_in_9),还有另外三个基本方向距离最远的源251n/251s/251e和查找表输出(lut_out)411a,对西面的长距离驱动器445w提供输出多路复用,以驱动西面的分段路由446w(l_w_out)。
66.图7示出了根据本发明的异构分段现场可编程逻辑门阵列的扇出图的示例。在扇出图中,“s”和“d”分别代表源和目的地,扇入信号和扇出信号分别经多个源扇入和目的地扇出。其中,中心源701扇出到64个目的地702,24个直驱目的地710为距离可编程区块最近的24个相邻目的地,为布线线网中的直接路由252,可以是预定义相邻距离的目的地,在一个实施例中,输出到2个垂直和水平距离。至于长距离目的地720,是向四个基本方向延伸,最远可达19个水平距离和19个垂直距离的目的地,为布线线网中的分段路由251,用于分段的长距离连接。如图3示出的shlrt中,为了直接到达19个水平距离和19个垂直距离内的目的地,扇出和扇入都需要接驳到每一行和每一列,因此每一个基本方向都需要19个目的地,以确保输出可以直接到达周围的布线线网,提高布线灵活性。
67.在一个实施例中,图7也可以为扇入图,与扇出图相同,只是将中间的“s”替换为“d”,并将“d”替换为“s”。在扇入图中,可以将64个周围的源位置直接驱动到中心目的地位置,周围的源包括距离可编程区块最近的24个相邻源,和向四个基本方向延伸,最远可达19个水平距离和19个垂直距离的长距离源。
68.根据具有u型转弯布线的shlrt 400的扇出安排,源和目的地不需要接驳到每一行
和每一列,如图中所示,向四个基本方向延伸的长距离目的地720,每个长距离目的地与相邻长距离目的地是分隔开的,即shlrt400的长距离目的地720交替接驳至交替行和交替列,由于此图是以源701为中心(0,0坐标),按x方向和y方向延伸,并完全对称的,长距离目的地720只扇出到单数的行和列,或在某些实施例中,亦可只接驳到扇出图中双数的行和列。以上对于目的地的描述亦同样适用于源。
69.图8示出了以两个具有u型转弯布线的shlrt 400来扇入或扇出到没有直接接驳的交替行或没有直接接驳的交替列,为方便理解,输出信号的是第一shlrt 400a,而进行u型转弯布线的是其相邻的第二shlrt400b。第一shlrt 400a在一个相邻方向上直接接驳到相邻的第二shlrt400b,s1是第一shlrt 400a的源,配置为驱动南面距离最远的目的地(d1),亦是第二shlrt 400b扇入的源(s2),由于本发明可以从所述相邻方向接收并发送扇入信号或扇出信号,从而扇入信号和扇出信号于相邻第二shlrt 400b进行u型转弯,并扇入或扇出到没有直接接驳的交替行或没有直接接驳的交替列。所以,第二shlrt 400b可扇出并接驳对第一shlrt 400a没有长距离目的地的行730。因此,即使扇入信号或扇出信号能够分别扇入或扇出到没有直接接驳的交替行或没有直接接驳的交替列,由于第一shlrt 400a和第二shlrt 400b交替接驳到之間每一条分段路由251,而距离hlr 201最远的源和目的地直接接驳到相邻可编程单元块(第二shlrt 400b),所以扇入信号和扇出信号经相邻可编程单元块进行u型转弯,使第一shlrt 400a可经相邻可编程单元块间接接驳上所述没有直接接驳的交替行或所述没有直接接驳的交替列。
70.本发明为了减少管芯面积和功耗,在输出多路复用器444上增加了一个新的输入边沿,这使分段路由251可以发送扇出信号回到其扇入的基本方向。因此,通过在相反方向上利用分段路由251的连接,可以降低输入多路复用器420的输入边沿的数量,从而减小了输入多路复用器420的大小。同样,由于分段路由251的扇出数量较小,因此可以利用更高的功率效率和更小的长距离驱动器445,节省管芯面积而不会有损性能。
71.通过分段路由251到分段路由251跃迁,去除从分段路由251到可编程区块的直接输入来缩小连接块202的尺寸。然而,交换块204中分段路由之间的路由选项增加了,以更有效地利用连接块202中的其余连接,保留路由选择可能性的组合。与交换块204的尺寸增益相比,从连接块202减小的尺寸更为显著。因此,可以减小现场可编程逻辑门阵列的总管芯面积。
72.这示出了根据本发明的一种具有u型转弯布线架构的现场可编程逻辑门阵列,其可以减少管芯面积和功耗而没有降低布线灵活性。显而易见的是,以上公开的以及其他特征和功能的变型或其替代形式可组合成许多其他不同的方法或装置。因此,本实施例在所有方面都应被视为是说明性的而非限制性的。本发明的范围由所附权利要求书而非由先前的描述指示,并且因此意图将落在权利要求书的等同形式的含义和范围内的所有改变均包括在内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献