2025中国(华东)智能家居技术创新研讨会5 广告 2025’中国电机智造与创新应用暨电机产业链交流会(春季)4 广告 第21届(顺德)家电电源与智能控制技术研讨会3 广告 2025中国电机智造与创新应用暨电机产业链交流会(华东)4 广告

升级电源和机架架构,满足AI服务器的需求

2025-02-11 14:35:16 来源:英飞凌科技 作者:Sam Abdel-Rahman

前言

人工智能(AI)的迅猛发展推动了AI数据中心处理能力的显著增长。如图1所示,英飞凌预测单台GPU的功耗将呈指数级上升,预计到2030年将达到约2000W[1],而AI服务器机架的峰值功耗将突破惊人的300kW。这一趋势促使AI数据中心机架的AC和DC配电系统进行架构升级,重在减少从电网到核心AI设备的电力转换和配送过程中的功率损耗。

基于x86和Arm®架构的服务器CPU与GPU和TPU的电力需求对比

图1:基于x86和Arm®架构的AI服务器CPU与GPU和TPU的电力需求对比

图2(右)展示了开放计算项目(OCP)AI服务器机架供电架构的示例。每个电源架由三相输入供电,可容纳多台PSU;每台PSU由单相输入供电。AI服务器机架将直流电压(例如,50V)输出到母线,母线则连接到IT和电池架。

AI的发展趋势要求对PSU功率进行革新,如图2(左)所示。接下来,我们将通过各代PSU的拓扑结构和AI应用器件技术建议示例,来逐步介绍这些PSU的演变。

AI服务器PSU的功率演变 服务器机架架构示例

图2 :AI服务器PSU的功率演变(左);服务器机架架构示例(右)

AI服务器机架PSU的趋势和功率演进

第一代AI PSU:在相同的架构下提升AI应用功率,~5.5-8kW、50Vout、277Vac、单相

当前的AI服务器PSU大多遵循ORv3-HPR标准[9]。相较于先前的ORv3 3kW标准[9],该AI应用标准的大部分要求(包括输入和输出电压以及效率)保持不变,但增加了与AI服务器需求相关的更新,例如,更高的AI应用功率和峰值功率要求(稍后详述)。此外,由于与BBU架的通信方式有所调整,输出电压的调节范围变得更窄。

尽管每个电源架都通过三相输入(400-480Vac L-L)供电(见图2),但每台PSU的输入仍为单相(230-277Vac)。图3展示了符合ORv3-HPR标准的第一代PSU的部署示例:PFC级可以采用两个交错的图腾柱拓扑结构,其中,650V CoolSiCTM MOSFET用于快臂开关,600V CoolMOSTM SJ MOSFET用于慢臂开关。DC-DC级可以选用650V CoolGaNTM晶体管的全桥LLC,次级全桥整流器和ORing则使用80V OptiMOSTM Power MOSFET。此外,示例还展示了一个中间级,也称“延长保持时间”或“小型升压”,其作用是减小大容量电容器的尺寸。该中间级由一个升压转换器组成,在线路周期掉电事件期间,通过储能电容器放电,以调节LLC输入电压。在正常运行期间,升压转换器保持空闲状态,并通过低阻抗的600V CoolMOSTM SJ MOSFET旁路。

第一代AI PSU的拓扑结构及器件技术示例

图3:第一代AI PSU的拓扑结构及AI应用器件技术示例

第二代AI PSU:增加线路电压,以实现更高的AI应用功率,~8-12kW、50Vout、277–347Vac、单相

如上所述,随着AI服务器机架功率增加到300kW以上,电源架的功率密度变得至关重要。因此,下一代PSU的设计方向是,在单相架构中实现8kW至12kW的输出功率。随着每个AI服务器机架的功率增加,AI数据中心中的机架数量在某些情况下,可能会受配电电流额定值和损耗的约束。因此,为了降低AI应用交流配电的电流和损耗,部分AI数据中心可能会将机架的交流配电电压从400/480V提高到600Vac L–L(三相),同时将PSU的输入电压从230/277Vac提高到347Vac(单相)。

虽然这一变化有利于AI数据中心的运行效率和资源利用,但会影响PSU的额定电压和设计。在347Vac的输入电压下,PFC的输出电压必须设定在575Vdc左右,这意味着传统的650V器件的额定电压已无法满足要求。图4展示了一个示例:第一代PSU使用的两电平图腾柱PFC被替换为400V CoolSiCTM MOSFET的三电平飞电容图腾柱PFC(3-L FCTP PFC)级。多电平功率转换概念使得在使用较低额定电压的AI服务器开关器件的同时,支持更高的输入电压。凭借多电平拓扑结构的频率倍增效应,3-L FCTP PFC能够带来更高的AI应用效率和功率密度。最重要的是,CoolSiCTM技术针对400V的较低击穿电压进行了优化,与650V和750V CoolSiCTM参考器件相比,其FoM更为优异(见图5(左))。此外,图5(右)显示了导通电阻在整个温度范围内的曲线,其中,400V CoolSiCTM MOSFET的RDS(on) 100°C仅比RDS(on) 25°C高11%。RDS(on)与Tj之间的这一平缓关系有助于CoolSiCTM MOSFET实现更高的RDS(on) typ,从而降低AI应用成本并提升AI服务器开关性能。

第二代AI PSU的拓扑结构和器件技术示例

图4:第二代AI PSU的拓扑结构和AI应用器件技术示例

 

品质因数 RDS(on)与Tj

图5:400V CoolSiCTM与650V和750V CoolSiCTM对比,具有更优的AI服务器开关FoM和稳定的RDS(on)与结温的关系:品质因数(左),RDS(on)与Tj(右)

对于DC-DC级来说,三相LLC拓扑结构是一种理想选择,其中,750V CoolSiCTM MOSFET用于初级侧开关,80V OptiMOSTM 5 Power MOSFET用于次级全桥整流器和ORing。由于增加了第三个半桥开关臂,该AI应用解决方案能够提供更高的功率,有效降低AI服务器输出电流的纹波,并通过三个AI服务器开关半桥之间的固有耦合实现自动电流分配。

第三代AI PSU:三相AI服务器架构与400V配电,最高AI应用功率约为22kW,400Vout,480-600Vac,三相

为了进一步提高AI服务器机架功率,第三代AI PSU将采用更具颠覆性的AI服务器机架架构,具体如下:

· PSU输入:AI应用从单相转为三相,以提高AI应用功率密度,并降低AI应用成本

· 电源架PSU输出电压:从50V提升到400V,以降低母线电流、损耗和成本

图6展示了一个三相输入、400V输出的PSU部署示例,以及推荐的AI服务器器件和技术。PFC级采用Vienna整流器,这是一种常用于三相PFC应用的拓扑结构。其主要优势在于采用分离式总线电压设计,因此可以使用650V器件:通过使用双倍数量的背靠背650V CoolSiCTM MOSFET和1200V CoolSiCTM二极管实现。PFC输出配置为分离式电容器,每个电容器电压为430V,并为全桥LLC转换器供电,该转换器在初级和次级侧均使用650V CoolGaNTM晶体管。两个LLC级在初级侧串联,次级侧并联,以向400V母线供电。

此外,也可以将两个背靠背的650V CoolSiCTM MOSFET替换为650V CoolGaNTM双向开关(BDS),后者是真正的常关型单片双向开关。这意味着一个CoolGaNTM BDS即可取代4个分立式电源开关,以实现相同的RDS(on),这是因为它在RDS(on)/mm2方面具备更高的芯片尺寸利用率。

第三代AI PSU的拓扑结构和器件技术示例

图6:第三代AI PSU的拓扑结构和AI应用器件技术示例

WBG为AI PSU带来的优势

CoolGaNTM助力实现高峰值功率瞬变

宽禁带(WBG)半导体(例如,CoolGaNTM[2])能够在更高的AI服务器开关频率下,实现最佳效率,使转换器在不影响转换效率的前提下,实现更高的AI应用功率密度,因此,成为AI PSU的理想选择。

除了AI PSU的额定功率显著增加外,GPU在AI服务器运行时还会拉动更高的峰值功率,并产生高负载瞬变(见图7)。因此,DC-DC级的输出必须具有足够的动态响应能力,同时需确保电压的过冲和下冲保持在规定的范围内。通过提升AI服务器开关频率,并增加控制AI环路带宽,可以提高DC-DC级的输出动态响应能力。

AI GPU所需的AI PSU峰值功率

图7:AI GPU所需的AI PSU峰值功率

400V CoolSiCTM MOSFET可在3-L飞电容图腾柱PFC中实现最高AI应用效率

使用 CoolSiCTM MOSFET 400V的三电平级飞跨电容图腾柱PFC(3-L FCTP PFC)不仅能够实现更高的交流输入电压(见第2.2节),且相较CoolSiCTM 650V和750V参考器件,该AI应用品质因数(FoM)更佳,因此还能提供显著的AI应用功率密度和效率优势。经过优化的电感器设计(包括尺寸、材料和绕组)和3L拓扑结构中的RDS(on)选择,结合更低的AI服务器开关损耗,能够实现平缓的效率曲线:峰值效率超过99.3%,满载效率超过99.15%(见图8)。

效率对比:3-L FCTP PFC与2-L TP PFC

图8:AI应用效率对比:3-L FCTP PFC与2-L TP PFC

结论

为了满足AI数据中心对AI应用的需求,新一轮AI技术角逐已经启动,推动了AI服务器机架和PSU的电力需求大幅增长。其中,AI PSU的功率需求已经从3-5.5kW,提升到8-12kW(单相)和高达22kW(三相)。这种需求给AI数据中心运营商带来了新的挑战,即如何优化AI数据中心的空间和电力的效率和利用率。应对这些AI应用挑战需要采用新的机架架构和AC-DC配电配置,使得基于CoolSiCTM和CoolGaNTM的AI设计处于PSU设计的前沿,致力于实现最佳AI应用效率和AI服务器功率密度。

此外,新的宽禁带器件在新型拓扑结构中也展现了极佳的AI应用性价比,例如,在三电平飞跨电容图腾柱PFC中采用400V CoolSiCTM MOSFET,或在三相Vienna PFC中使用650V CoolGaNTM BDS(详见前文)。

总而言之,英飞凌的功率器件技术组合(硅、碳化硅和氮化镓)和经过优化的栅极驱动IC产品组合,通过AI混合应用,为当前和下一代AI应用平台及趋势的发展提供了支持。这些AI应用组合充分利用了三种技术的优势,使PSU设计实现了最佳灵活性,并在效率、功率密度和系统成本之间达成平衡。此外,英飞凌还率先推出了全球首项300毫米氮化镓功率半导体等先进技术,进一步推动了文章[10]中所述的未来AI服务器设计发展。

 

参考文献  

[1] Infineon Technologies AG: We power AI, Online Media Briefing; https://www.infineon.com/dgdl/Online-Media-Briefing-We-Power-AI.pdf?fileId=8ac78c8b901005350190112f55a20002

[2] Infineon Technologies AG: Wide Bandgap Semiconductors (SiC/GaN); https://www.infineon.com/cms/en/product/technology/wide-bandgap-semiconductors-sic-gan/

[3] Infineon Technologies AG: GaN transistors (GaN HEMTs); https://www.infineon.com/gan

[4] Infineon Technologies AG: Silicon Carbide MOSFET Discretes; https://www.infineon.com/cms/en/product/power/mosfet/silicon-carbide/discretes/

[5] Infineon Technologies AG: Server and data center 3 kW 50 V PSU – Engineering report; https://www.infineon.com/dgdl/Infineon-Evaluation_board_EVAL_3KW_50V_PSU-ApplicationNotes-v01_00-EN.pdf?fileId=5546d46278d64ffd0178f986be9e08a7

[6] Infineon Technologies AG: 3300 W CCM bidirectional totem pole with 650 V CoolSiC™ and XMC™– Infineon Technologies application note; https://www.infineon.com/dgdl/Infineon-Evaluationboard_EVAL_3K3W_TP_PFC_SIC-ApplicationNotes-v01_00-EN.pdf?fileId=5546d4626fc1ce0b016fc2ae66e20040

Infineon Technologies AG: 3.3 kW high-frequency and high-density PSU for server and datacenter applications; https://www.infineon.com/dgdl/Infineon-3.3_kW_high-frequency_and_high-density_PSU_for_server_and_datacenter_applications-ApplicationNotes-v01_00-EN.pdf?fileId=8ac78c8c90530b3a0190779314d375eb

[7] Infineon Technologies AG: CoolSiC™ totem-pole PFC design guide and power loss modeling– Infineon Technologies application note; https://www.infineon.com/dgdl/Infineon-Application_note_CoolSiC_Totem_Pole_PFC_Design_and_Power_Loss_Modeling-ApplicationNotes-v01_00-EN.pdf?fileId=8ac78c8c85ecb34701865a064ec24076

[8] Infineon Technologies AG: CoolGaN™ totem-pole PFC design guide and power loss modeling – Infineon Technologies application note; https://www.infineon.com/dgdl/Infineon-Design_guide_Gallium_Nitride-CoolGaN_totem-pole_PFC_power_loss_modeling-ApplicationNotes-v01_00-EN.pdf?fileId=5546d4626d82c047016d95daec4a769a

[9] Open Compute Project Foundation: ORv3-HPR standard;

https://www.opencompute.org/wiki/Open_Rack/SpecsAndDesigns

[10] Infineon Technologies AG: Infineon pioneers world's first 300 mm power gallium nitride (GaN) technology – an industry game-changer; https://www.infineon.com/cms/en/about-infineon/press/press-releases/2024/INFXX202409-142.html

[11] Infineon Technologies AG: Powering AI PSU solutions; https://www.infineon.com/cms/en/product/promopages/AI-PSU/

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请与我们联系,我们将及时更正、删除,谢谢。
Big-Bit 商务网

请使用微信扫码登陆