Skip to main content

FPGA时序约束--实战篇

·146 words·1 min
FPGA FPGA Xilinx
Table of Contents

前面几篇文章介绍了“如何写时序约束”和“如何看懂时序约束报告”,这些知识点都是基础,可以知道设计的HDL代码不收敛的位置,但解决时序收敛问题更关键。

FPGA时序不收敛,会出现很多随机性问题,上板测试大概率各种跑飞,而且不好调试定位原因,所以在上板测试前,先优化时序,再上板。

今天我们就来唠一唠解决时序不收敛的问题,分享一些常用的解决办法和思路。

模块运行时钟频率
#

设计模块前,需明确模块运行的最大时钟频率。

不同时钟频率下,对应的时序约束最大延时是不一样的。

比如100MHz时钟下运行的HDL逻辑,比200MHz时钟下的HDL逻辑,支持的组合逻辑层数多。

根据最大时钟频率,来设计HDL代码的层级,时钟频率越高,插入寄存器要更多,增加流水线级数,减少过长的组合逻辑。

HDL代码
#

  1. HDL代码风格

优先参考FPGA开发软件提供的HDL Template,比如Vivado的language template。

FPGA Timing Constraint

  1. HDL代码逻辑优化

对于复杂的算法代码逻辑,需要结合FPGA并行计算和最小处理单位为bit的特性,对逻辑代码进行优化实现。

明确变量最大的数据位宽。

逻辑代码中,一些软件逻辑实现起来较复杂,尽量简化,删除掉一些不可能出现的情况。

这部分代码逻辑,可能需要重复迭代几遍实现才行。

组合逻辑层数
#

  1. 插入寄存器

将计算逻辑分成多个时钟周期实现,这是常用的时序优化方法,可以减少过多的组合逻辑层数,但会增加延时。

这里以一个多路输入求和计算为例

module sum(
    input        clk,
    input  [15:0] data_A,
    input  [15:0] data_B,
    input  [15:0] data_C,
    input  [15:0] data_D,
    output [17:0] sum_o);

    always @(posedge clk) begin
        sum_o <= data_A + data_B + data_C + data_D;
     end

endmodule

增加寄存器后,改为

module sum(
    input        clk,
    input  [15:0] data_A,
    input  [15:0] data_B,
    input  [15:0] data_C,
    input  [15:0] data_D,
    output [17:0] sum_o);

    reg [16:0] sum0, sum1;

    always @(posedge clk) begin
        sum0 <= data_A + data_B;
        sum1 <= data_C + data_D;
     end

    always @(posedge clk) begin
        sum_o <= sum0 + sum1;
     end

endmodule
  1. 逻辑展平设计

优化代码中优先级译码电路逻辑,主要出现在IF/ELSE结构语句中,这样逻辑结构被展平,路径延迟得以缩短。

IF ELSE结构语句存在明显的优先级,建议尽量用CASE语句来替代。

  1. 防止变量被优化

HDL综合布线软件会根据实际情况,自动优化代码逻辑,可能存在将多个不同寄存器变量合并成一个寄存器变量的情况。

对于不希望被优化的变量,可以在变量定义前,添加(* keep = “ture” *)

高扇出
#

高扇出问题,原因是一个寄存器驱动后级数超过了它本身的驱动能力,导致延迟时间过大,不满足时序。

  1. 使用max_fanout

在变量定义前,可以添加(* max_fanout = n *),来设置变量的最大扇出数,超过这个扇出数,综合软件会自动复制多份变量。

  1. 复位信号高扇出

复位信号是常见的高扇出问题,主要解决办法有:

  • 减少复位信号的使用,能使用使能信号控制的,就用使能信号。
  • 对于大型模块,复位信号可以使用BUFG来驱动复位信号,可以增加复位信号的驱动能力

资源消耗
#

FPGA器件的整个工程资源消耗,不管是LUT还是BRAM等资源,建议不超过80%。

一旦资源消耗超过80%,在布线综合时,就出现布线资源不够,导致出现布线拥塞,从而出现了时序不收敛的情况。

布线拥塞也分为全局拥塞和局部拥塞,可能是高扇出信号过多,也可能是局部布线资源不够用,导致时序路径过长。

  1. 优化代码逻辑,减少资源消耗。

在资源不够用的情况下,建议检查代码是否可优化,设置的RAM大小是否过大等等。

  1. 使用替代资源实现

在FPGA中实现RAM时,可以根据整个资源的使用情况,考虑使用Distributed RAM、URAM等资源来减少BRAM的消耗。

总结
#

本文分享了时序收敛的一些方法和思路,希望可以给大家带来一点启发。

Related

5款超强大的FPGA开发板
·249 words·2 mins
FPGA FPGA Xilinx Microsemi Stratix 10
ZYNQ 读写SD卡
·417 words·2 mins
FPGA FPGA Xilinx ZYNQ SD
FPGA硬核和软核处理器的区别
·47 words·1 min
FPGA CPU FPGA Processor Altera Xilinx