FPGA block RAM和distributed RAM区别（以及xilinx 7系列CLB资源）

作者：小小林熬夜学编程 | 2024-05-26 09:48:17

踩

原地地址：FPGA block RAM和distributed RAM区别

区别之1

block ram 的输出需要时钟，distributed ram在给出地址后既可输出数据。
区别之2
distributed ram使用更灵活方便些
区别之3
block ram有较大的存储空间，distributed ram浪费LUT 资源
补充：
1，物理上看，block ram是fpga中定制的ram资源，distributed ram就是用逻辑单元拼出来的。
2，较大的存储应用，建议用block ram ; 零星的小ram，一般就用distributed ram。但这只是个一般原则，具体的使用得看整个设计中资源的冗余度和性能要求

3，distributed ram可以是纯组合逻辑，即给出地址马上出数据，也可以加上register变成有时钟的ram。而block ram一定是有时钟的。

原文地址：块RAM与分布式RAM的区别

块RAM 和分布式RAM

① Xilinx 的FPGA结构主要由CLB、IOB、IR、Block RAM组成，其中CLB是最最重要的资源。

② 以V5为例，1个CLB包括的2个Slice，每个Slice包括4个6输入查找表，4个FlipFlop和相关逻辑。在这里需要注意的是Slice分两种，SliceM和SliceL，它们都包括前面的东西，但是很特别的是SliceM还增加了基于查找表的分布式RAM和移位寄存器。

③ 每个CLB中都包含SliceL，但并不是每个CLB中都包含SliceM，整个一块V5芯片中SliceM和SliceL的比例为1：3。SliceM的放置有一定的规则，这里不做阐述。

④ Xilinx的FPGA中有分布式RAM 和 Block RAM 两种存储器。用分布式RAM 时其实要用到其所在的SliceM，所以要占用其中的逻辑资源；而Block RAM 是单纯的存储资源，但是要一块一块的用，不像分布式RAM 想要多少bit都可以。

⑤ 用户申请存储资源，FPGA先提供Block RAM ，当Block RAM 数量不够时再用分布式RAM补充。

原文地址：xilinx 7系列CLB资源

以下分析基于xilinx 7系列

CLB是xilinx基本逻辑单元，每个CLB包含两个slices，每个slices由4个（A,B,C,D）6输入LUT和8个寄存器组成。

同一CLB中的两片slices没有直接的线路连接，分属于两个不同的列。每列拥有独立的快速进位链资源。

slice分为两种类型 SLICEL, SLICEM . SLICEL可用于产生逻辑，算术，ROM。 SLICEM除以上作用外还可配置成分布式RAM或32位的移位寄存器。每个CLB可包含两个SLICEL或者一个SLICEL与一个SLICEM.

7系列的LUT包含6个输入 A1 -A6 , 两个输出 O5 , O6 .

可配置成6输入查找表，O6此时作为输出。或者两个5输入的查找表，A1-A5作为输入 A6拉高，O5，O6作为输出。

一个LUT包含6个输入，逻辑容量为2^6bit，为实现7输入逻辑需要2^7容量，对于更多输入也一样。每个SLICES有4个LUT，256bit容量能够实现最多8bit输入的逻辑。为了实现此功能，每个SLICES还包括3个MUX(多路选择器)

F7AMUX 用于产生7输入的逻辑功能，用于连接A,B两个LUT

F7BMUX 用于产生7输入的逻辑功能，用于连接C,D两个LUT

F8MUX 用于产生8输入的逻辑功能，用于连接4个LUT

对于大于8输入的逻辑需要使用多个SLICES, 会增加逻辑实现的延时。

一个SLICES中的4个寄存器可以连接LUT或者MUX的输出，或者被直接旁路不连接任何逻辑资源。寄存器的置位/复位端为高电平有效。只有CLK端能被设置为两个极性，其他输入若要改变电平需要插入逻辑资源。例如低电平复位需要额外的逻辑资源将rst端输入取反。但设为上升/下降沿触发寄存器不会带来额外消耗。

分布式RAM

SLICEM可以配置成分布式RAM，一个SLICEM可以配置成以下容量的RAM

多bit的情况需要增加相应倍数的LUT进行并联。

分布式RAM和 BLOCK RAM的选择遵循以下方法：

1. 小于或等于64bit容量的的都用分布式实现

2. 深度在64~128之间的，若无额外的block可用分布式RAM。要求异步读取就使用分布式RAM。数据宽度大于16时用block ram.

3. 分布式RAM有比block ram更好的时序性能。分布式RAM在逻辑资源CLB中。而BLOCK RAM则在专门的存储器列中，会产生较大的布线延迟，布局也受制约。

移位寄存器（SLICEM）

SLICEM中的LUT能在不使用触发器的情况下设置成32bit的移位寄存器, 4个LUT可级联成128bit的移位寄存器。并且能够进行SLICEM间的级联形成更大规模的移位寄存器。

MUX

一个LUT可配置成4:1MUX.

两个LUT可配置成最多8:1 MUX

四个LUT可配置成16个MUX

同样可以通过连接多个SLICES达成更大规模设计，但是由于SLICE没有直接连线，需要使用布线资源，会增加较大延迟。

进位链

每个SLICE有4bit的进位链。每bit都由一个进位MUX(MUXCY)和一个异或门组成，可在实现加法/减法器时生成进位逻辑。该MUXCY与XOR也可用于产生一般逻辑。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/626180