微捷码:下一代IC设计不再悲观

2010-12-10 09:56:32 来源:网络

工程师进行更高节点设计时会遇到许许多多的问题,包括:低功耗设计、串扰效应、工艺变异及操作模式和角点数量的显着增加。除了上述技术问题以外,日益提高的设计规模和复杂性还造成了工程资源、硬件资源、满足日益紧张的开发时间表等方面相关问题的增加。日前,微捷码(Magma)公司针对20nm及其以下工艺节点设计问题,推出了下一代IC实施解决方案Talus 1.2,将有望解决这些问题。

据称,全新Talus系统让工程师能够在考虑串扰规避、高级片上变异(AOCV)和多模/多角(MM/MC)分析的情形下以每天100-150万单元的处理能力完成200-500万单元规模的设计或模块的实现。

Talus 1.2的关键实现技术包括了全新的Talus MX时序(Timer)和提取(Extractor)引擎。这些分析引擎以Magma下一代签核时序器Tekton与签核提取器QCP的底层技术为基础,可贯穿应用于整个Talus 1.2的RTL-to-GDSII流程。并通过提供AOCV、MM/MC分析等新功能,确保了贯穿整个流程时的紧密时序关联。当与Tekton和QCP结合使用时,Talus 1.2可在设计实施期间提供签核级精度的分析,避免时序ECO,实现更快速的设计收敛。

目前,鉴于功耗仍是芯片设计最为关心的问题,工程师往往通过部署各种各样的技术来控制器件的动态功耗和漏电功耗,包括多开关阈值(multi-Vt)晶体管的使用、多电源多电压(MSMV)、动态电压与频率缩放(DVFS)及电源关断(PSO)。Magma方面提供的资料显示,Talus Vortex 1.2提供了一款完整的集成化低功耗解决方案,可与跨多电压和频率区域的并行分析与优化功能结合使用。Talus 1.2不仅不会对所使用的不同晶体管开关阈值的数量进行限制,同时还支持无限的电压、频率和电源切断区域。此外,Talus 1.2还完全支持通用功率格式(CPF)和统一功率格式(UPF)。

同时,在32/28nm及以下工艺节点上,片上变异(OCV)变得极为重要。这是由于随着每个新技术节点的推出,控制如晶体管结构的宽度和厚度、轨道和氧化层等关键尺寸变得更为困难,最终导致相对变异百分率会随着每个新的技术节点而变得更大。Bob Smith介绍说,解决OCV的传统方式是使用一阶方案(first-order approach)。不过在32/28nm节点,这种方法过于悲观,会导致过度设计、设计性能降低和时序收敛周期变长。因此Talus 1.2部署了复杂的、但更为实际的AOCV算法,基于单元和轨道的邻近性来应用上下文特定的降额值。

对于28nm及以下设计实施来说,另一种十分常见的设计来自于需要多种不同时序情景(工艺角点x时序模式)分析。多数解决方案在设计实施期间只提供5-8个时序情景的分析能力。而Talus 1.2可在单台设备上执行并发MM/MC,能够管理较传统解决方案5倍的情景,同时还提供了10倍的运行时间改善。此外,为了避免在流程结束阶段才进行串扰管理所带来的不利影响,Talus1.2可贯穿整个实施流程识别并控制串扰,以更少的时序意外情况提供更为收敛的流程,并在不增加面积和漏电的前提下,提供更短的运行时间和更具鲁棒性设计。

与Talus 1.2同步推出的产品还包括Talus Vortex FX。由于采用了分布式智能同步(Distributed Smart Sync)技术,相较Talus 1.2,Vortex FX能够提供多至3倍的性能提升,从而使设计师能够顺畅地使用现有硬件资源,每天产生200-500万个单元级电路。也就是说,Talus Vortex FX为物理实现团队提供了在设计周期早期执行快速的假设分析的能力,实现了优化的面积、速度和功耗间折衷权衡。

Magma分布式智能同步技术

Smith对此解释说,在过去,一直是通过提供多线程功能来增强物理实现工具的容量和性能。有些情况下,这些功能是被“生搬硬套”到的传统工具上,效果有限。但总体来看,多线程对工具的作用十分有限:基于阿姆达尔定律(Amdahl's law)等计算机科学定律,线程的数量越来越多所起到的效果却越来越小。简单来讲,就是任何程序的加速均会受到并行数量的限制。

因此,这种分布式技术背后的概念是对一个更大型的设计或模块进行智能分割,将设计分区分散到整个网络的服务器上执行设计实现,最后在主要流程阶段自动对这些设计实施重新同步。本质上,这让设计师能够处理更大型设计,同时仍可获得与他们之前在规模更小得多的电路模块上所实现的相同的吞吐量,甚至在使用同等数量的内核/线程的时候,这种分布式方案的处理速度也较最佳多线程扁平流程要快上2-3倍。

Talus Vortex FX基于Talus 1.2的功能而创建,后者具备的智能内存使用技术允许Talus Vortex FX运行于各种标准服务器平台上,一般是配置为4-8个处理器核心和64 GB内存的平台。据说,若未采用这项技术而转向32/28纳米节点设计,那么将要求用户的设备要升级为内存128 GB 或256 GB的设备,碰到大型服务器场的话这可能需耗费几百万美元。

本文为哔哥哔特资讯原创文章,未经允许和授权,不得转载,否则将严格追究法律责任;
Big-Bit 商务网

请使用微信扫码登陆

x
凌鸥学园天地 广告