高性能数字信号处理的Virtex-5 SXT选择方案
2010-12-20 15:00:45
来源:半导体器件应用网
1. 引言
信息时代对数据的渴求推动着数字融合。三网合一、医学影像、图像处理、国防、航空航天、安全和加密,这些都需要提高数字信号处理(DSP)的性能,这种形势使传统的解决方案、技术和方法力不从心。
只要探讨一下技术的进步以及算法复杂性的随之提高,就会明白这一点,算法之复杂使现有的解决方案精疲力竭。图1用香农极限(通讯信道在给定噪声电平下的理论最大信息传输率)来说明这一点。如图1所示,传统的通用处理器(GPP)和DSP解决方案无法有效解决这一极限问题。
变通办法是用FPGA技术来实现数字信号处理算法,与传统解决方案相比,这种办法可将性能提高一个数量级。设计Xilinx® VirtexTM-5 SXT器件系列就是为了满足这种变通的FPGA方法,此法可提供独特的资源比,从而尽可能有效提高数字信号处理的性能。
2. 传统DSP对FPGA DSP
即使是最复杂的DSP算法,只要将其分解成最基本的部分,就会发现是乘法器、加法器和一些延迟单元。将这些基本元件组合起来,即使最复杂的DSP算法也可以实现。
传统的DSP解决方案是顺序控制逻辑与若干算术逻辑单元(ALU)的组合。ALU提供乘加功能,而顺序控制逻辑则负责代码解释和控制。其带宽由系统的频率和可并列运行的ALU的数量决定。以2GHz基频运行并具有八个并行ALU的解决方案可提供16GMAC(每秒160亿次乘累加运算)的DSP带宽。
FPGA通过可编程逻辑或固化的嵌入式处理器提供用户定义控制。提高性能的主要因素是提供乘加功能的DSP Slice可变数量(见图2)。其带宽由基频和DSP Slice的数量决定。Virtex-5 SXT器件最高以550MHz频率运行,具有多达640个DSP Slice,因此最高可提供352GMAC的DSP带宽。在给定频率下,与最先进的传统DSP解决方案相比,Virtex-5 SXT解决方案可提供的DSP资源数多达40倍。
3. Virtex-5 SXT高性能DSP解决方案
Virtex-5 SXT FPGA能获得如此高的DSP带宽,其关键是解决方案设计精良,这种方案可以达到550MHz的性能,并且可通过专用资源减少系统瓶颈。能实现如此宽完善的解决方案,其关键主要是以下因素:
(1) DSP48E运用了脉动实现方法,允许Virtex-5器件中640个自成一体的DSP48E Slice各自独立工作或相互结合工作,在各Slice之间使用完全相同的互连(见图3)。
(2) Virtex-5器件中的DSP48E Slice已经针对65纳米工艺尺寸进行了优化,并且为达到最高性能而使用了Arithmetica提供的先进的MathIP。
(3) 整个系统(包括DSP48E Slice、处理器系统、可编程逻辑和存储器)均设计成使用一个外部系统时钟协同工作,时钟工作频率可达550MHz。系统性能协调一致、可以控制且恒久稳定。
4. 使用Virtex-5 SXT解决方案
传统的DSP解决方案和使用Virtex-5 SXT FPGA的解决方案各有千秋。传统DSP享有在顺序控制逻辑或处理器上运行的现成代码库。这种解决方案可以重复使用现有代码,并且可提供易用的编程模型。
FPGA可以提供灵活且可缩放的较高单片性能,但要求实现过程使用新工具集或FPGA设计方法。根据应用、所需性能或解决方案历史不同,一种方案可能优于另一种。两种解决方案相结合常常是最佳选择。为了说明可能的实现方法,下面探讨三种不同的任务、可能的解决方案以及这些解决方案的优点。
示例1:遗留系统,需要使用整套算法库和实现方法,其性能近乎枯竭。
示例1的方案:找出DSP的性能瓶颈,然后在Virtex-5 SXT FPGAk中实现该部分设计。通过提高设计的速度来达到所需性能。
(1) 示例1方案的优点:这种解决方案让工程师能够保留具有灵活性、易用性和符合性的遗留代码,同时提高系统性能。为此,用一个较小的Virtex-5 SXT器件对传统DSP进行协处理或预处理加速可能是理想的方法。传统DSP解决方案与Virtex-5 SXT器件之间的通讯可以用SelectIOTM技术完成,也可以用GTP高速串行收发器完成。根据设计的复杂性和FPGA中执行的算法,使用外部技术资源可能对实现有所帮助。
(2) 示例2:由于性能要求,必须用全新的实现方法大幅度提高性能。
示例2的方案:将整个设计重新实现成一个较大的Virtex-5 SXT器件。使用可编程逻辑、I/O和内部Block RAM实现等效的控制功能。借助脉动架构所允许的广泛并行的设计方法,用DSP Slice实现较高速的DSP算法。使用Xilinx公司的System Generator for DSP或AccelDSPTM综合工具,以克服使用新设计方法的难度。
示例2方案的优点:用单片解决方案即可将性能提高几个数量级。与使用多DSP芯片实现的传统解决方案相比,可以节省电路板空间并降低BOM成本(见图4)
(3) 示例3:在标准FPGA实现的基础上,使用任何Virtex-5 FPGA中都有的DSP Slice来实现高性能DSP算法。鉴于需要较多DSP资源,改用引脚兼容的Virtex-5 FPGA平台。
示例3的方案:重新设计现有的实现方案,同时利用Virtex-5 SXT器件的DSP资源、参考设计和设计方法。
示例3方案的优点:较高性能的集成解决方案,借助任何Virtex-5 FPGA器件和平台都有的DSP Slice尽可能提高可缩放性和并行性。
尽管Virtex-5 FPGA系列中的DSP slice可以快捷灵活地实现数字信号处理,但必须考虑整个解决方案。高速数据平面处理不仅需要高性能的DSP,还需要快速的输入、输出以及存储数据和系数的存储器。
千兆位级高速串行收发器可与FPGA之间往来传输数据流,而Block RAM和分布式RAM的独特比率极适合样本数据和系数存储,能将这二者结合起来的FPGA非Virtex-5 SXT器件莫属。最后,SelectlO接口配合ChipSyncTM技术可以实现简单高效的存储器接口,从而简化印刷电路板的布局。将这些与能适应标准变化的灵活的可编程技术结合起来,即可缩短设计时间,以满足咄咄逼人的上市时间和存市时间要求。
为了降低成本,可以采用符合EasyPathTM方案的Virtex-5 SXT系列,这样可节约成本达40%,但仍可使用DSP48E Slice或千兆位级收发器(MGT)。
5. 结论
当数字融合迫使数字信号处理性能超越传统解决方案之所能时,即可寻求FPGA解决方案。无论是加速传统的DSP解决方案,还是着手新的高性能设计,或者是重新考虑您目前的FPGA用法,Xilinx都可以为您取得成功提供恰当的技术、工具、IP和参考设计。
信息时代对数据的渴求推动着数字融合。三网合一、医学影像、图像处理、国防、航空航天、安全和加密,这些都需要提高数字信号处理(DSP)的性能,这种形势使传统的解决方案、技术和方法力不从心。
只要探讨一下技术的进步以及算法复杂性的随之提高,就会明白这一点,算法之复杂使现有的解决方案精疲力竭。图1用香农极限(通讯信道在给定噪声电平下的理论最大信息传输率)来说明这一点。如图1所示,传统的通用处理器(GPP)和DSP解决方案无法有效解决这一极限问题。
变通办法是用FPGA技术来实现数字信号处理算法,与传统解决方案相比,这种办法可将性能提高一个数量级。设计Xilinx® VirtexTM-5 SXT器件系列就是为了满足这种变通的FPGA方法,此法可提供独特的资源比,从而尽可能有效提高数字信号处理的性能。
2. 传统DSP对FPGA DSP
即使是最复杂的DSP算法,只要将其分解成最基本的部分,就会发现是乘法器、加法器和一些延迟单元。将这些基本元件组合起来,即使最复杂的DSP算法也可以实现。
传统的DSP解决方案是顺序控制逻辑与若干算术逻辑单元(ALU)的组合。ALU提供乘加功能,而顺序控制逻辑则负责代码解释和控制。其带宽由系统的频率和可并列运行的ALU的数量决定。以2GHz基频运行并具有八个并行ALU的解决方案可提供16GMAC(每秒160亿次乘累加运算)的DSP带宽。
FPGA通过可编程逻辑或固化的嵌入式处理器提供用户定义控制。提高性能的主要因素是提供乘加功能的DSP Slice可变数量(见图2)。其带宽由基频和DSP Slice的数量决定。Virtex-5 SXT器件最高以550MHz频率运行,具有多达640个DSP Slice,因此最高可提供352GMAC的DSP带宽。在给定频率下,与最先进的传统DSP解决方案相比,Virtex-5 SXT解决方案可提供的DSP资源数多达40倍。
3. Virtex-5 SXT高性能DSP解决方案
Virtex-5 SXT FPGA能获得如此高的DSP带宽,其关键是解决方案设计精良,这种方案可以达到550MHz的性能,并且可通过专用资源减少系统瓶颈。能实现如此宽完善的解决方案,其关键主要是以下因素:
(1) DSP48E运用了脉动实现方法,允许Virtex-5器件中640个自成一体的DSP48E Slice各自独立工作或相互结合工作,在各Slice之间使用完全相同的互连(见图3)。
(2) Virtex-5器件中的DSP48E Slice已经针对65纳米工艺尺寸进行了优化,并且为达到最高性能而使用了Arithmetica提供的先进的MathIP。
(3) 整个系统(包括DSP48E Slice、处理器系统、可编程逻辑和存储器)均设计成使用一个外部系统时钟协同工作,时钟工作频率可达550MHz。系统性能协调一致、可以控制且恒久稳定。
4. 使用Virtex-5 SXT解决方案
传统的DSP解决方案和使用Virtex-5 SXT FPGA的解决方案各有千秋。传统DSP享有在顺序控制逻辑或处理器上运行的现成代码库。这种解决方案可以重复使用现有代码,并且可提供易用的编程模型。
FPGA可以提供灵活且可缩放的较高单片性能,但要求实现过程使用新工具集或FPGA设计方法。根据应用、所需性能或解决方案历史不同,一种方案可能优于另一种。两种解决方案相结合常常是最佳选择。为了说明可能的实现方法,下面探讨三种不同的任务、可能的解决方案以及这些解决方案的优点。
示例1:遗留系统,需要使用整套算法库和实现方法,其性能近乎枯竭。
示例1的方案:找出DSP的性能瓶颈,然后在Virtex-5 SXT FPGAk中实现该部分设计。通过提高设计的速度来达到所需性能。
(1) 示例1方案的优点:这种解决方案让工程师能够保留具有灵活性、易用性和符合性的遗留代码,同时提高系统性能。为此,用一个较小的Virtex-5 SXT器件对传统DSP进行协处理或预处理加速可能是理想的方法。传统DSP解决方案与Virtex-5 SXT器件之间的通讯可以用SelectIOTM技术完成,也可以用GTP高速串行收发器完成。根据设计的复杂性和FPGA中执行的算法,使用外部技术资源可能对实现有所帮助。
(2) 示例2:由于性能要求,必须用全新的实现方法大幅度提高性能。
示例2的方案:将整个设计重新实现成一个较大的Virtex-5 SXT器件。使用可编程逻辑、I/O和内部Block RAM实现等效的控制功能。借助脉动架构所允许的广泛并行的设计方法,用DSP Slice实现较高速的DSP算法。使用Xilinx公司的System Generator for DSP或AccelDSPTM综合工具,以克服使用新设计方法的难度。
示例2方案的优点:用单片解决方案即可将性能提高几个数量级。与使用多DSP芯片实现的传统解决方案相比,可以节省电路板空间并降低BOM成本(见图4)
(3) 示例3:在标准FPGA实现的基础上,使用任何Virtex-5 FPGA中都有的DSP Slice来实现高性能DSP算法。鉴于需要较多DSP资源,改用引脚兼容的Virtex-5 FPGA平台。
示例3的方案:重新设计现有的实现方案,同时利用Virtex-5 SXT器件的DSP资源、参考设计和设计方法。
示例3方案的优点:较高性能的集成解决方案,借助任何Virtex-5 FPGA器件和平台都有的DSP Slice尽可能提高可缩放性和并行性。
尽管Virtex-5 FPGA系列中的DSP slice可以快捷灵活地实现数字信号处理,但必须考虑整个解决方案。高速数据平面处理不仅需要高性能的DSP,还需要快速的输入、输出以及存储数据和系数的存储器。
千兆位级高速串行收发器可与FPGA之间往来传输数据流,而Block RAM和分布式RAM的独特比率极适合样本数据和系数存储,能将这二者结合起来的FPGA非Virtex-5 SXT器件莫属。最后,SelectlO接口配合ChipSyncTM技术可以实现简单高效的存储器接口,从而简化印刷电路板的布局。将这些与能适应标准变化的灵活的可编程技术结合起来,即可缩短设计时间,以满足咄咄逼人的上市时间和存市时间要求。
为了降低成本,可以采用符合EasyPathTM方案的Virtex-5 SXT系列,这样可节约成本达40%,但仍可使用DSP48E Slice或千兆位级收发器(MGT)。
5. 结论
当数字融合迫使数字信号处理性能超越传统解决方案之所能时,即可寻求FPGA解决方案。无论是加速传统的DSP解决方案,还是着手新的高性能设计,或者是重新考虑您目前的FPGA用法,Xilinx都可以为您取得成功提供恰当的技术、工具、IP和参考设计。
本文为哔哥哔特资讯原创文章,未经允许和授权,不得转载,否则将严格追究法律责任;
暂无评论