数据中心不断演进以满足AI的巨大电力需求

随着大型语言模型彻底改变我们访问数据的方式,人工智能(AI)的进步正在颠覆各行各业及社会对数据中心计算资源的运用模式。我们正逐步进入能够直接向AI提问并获取详尽答案的时代,这与向真人提问无异,而非仅仅在搜索引擎中输入特定关键词。当然,这仅是AI能力的冰山一角。AI还能编写代码、生成图像和视频、完成会议记录与纪要。为实现所有这些AI功能,需要的电力急剧攀升。
要提供如此大的电力并确保AI处理器能够充分发挥其潜力,需要重新构想数据中心的IT服务器机架结构,以及获取与输送电力的最佳方式。本文将深入探讨三个核心议题:数据中心如何获取电力并输送至执行计算任务的服务器功能;为何必须改变配电架构才能满足快速演进的AI计算与电力需求;以及如何实现这种变革。
图1展示了IT服务器机架级电力需求随时间的变化趋势。图1预计,到2028年单个IT机架将需要1.5MW的电力,这是当前服务器机架所消耗电力的10倍。

图1. 机架级电力需求
演进简史
为理解数据中心与服务器内电力输送网络所发生的巨大变革,我们有必要先回顾一下当前的架构。图2所示为第一代配电架构,自20世纪90年代至今,该架构一直在服务器和数据中心领域占据主导地位。图2的左上区域为来自交流电网的三相交流电。此电力通过变压器从约13kV的“中压”降为480V交流线电压。不间断电源(UPS)为此电压提供缓冲。
当交流电网断电时,UPS利用本地蓄电池和逆变器功能维持数据中心服务器的运行,直至自动转换开关(ATS)或静态转换开关(STS)启动备用发电机接管供电。480V交流线电压相当于277VAC相电压。
将277VAC的三相电力输送至IT服务器机架后,电源单元(PSU)将执行功率因数校正(PFC)并生成稳定的12V输出,以便分配至服务器IT托盘。这种12V配电电压适用于第一代架构,为各种负载、电压稳压器和其他负载点稳压器(PoL)供电,产生电压以为整个服务器托盘中使用的处理器、存储器和通信集成电路供电。当总机架功率约为10kW至20kW时,这种架构运行良好。然而,随着对更高计算能力的需求增加,支撑这些AI计算功能所需的电力也在增加。

图2. 第一代传统机架服务器
图3展示了数据中心配电架构的下一次演进。从图3的左上区域可见,此架构起始于相同的中压输入电源。与第一代架构类似,变压器将三相13kV转换为480VAC线电压。此架构不再采用UPS,而是将等效的277VAC相电压直接输送至IT机架内部的本地PSU。这些PSU不再专用于每个服务器托盘,而是整合在统一的电源架中。在此背景下,电源架本质就是一组电源,其输出共同承担IT设备的负载需求。
N+1配置中的每个电源架通常包含六个PSU,以实现冗余。可通过添加电源架来满足IT机架的总电力需求。这些电源架输出50VDC总线电压,通过沿服务器机架背面铺设的大电流汇流排分配至各个IT托盘。一些第二代装置保留了UPS功能,而其他装置会将其移除(如图3所示)并替换为本地电池备份单元(BBU),使50VDC总线维持供电,直至电源恢复或备用发电机接管供电。在某些情况下,电容器架或电容器备用单元(CBU)有助于消除与任何电源中断相关的过大电压瞬变和电流瞬变。每个IT托盘内的50V总线连接到本地中间总线转换器,产生为IT托盘中系统负载供电所需的12V电压。

图3. 第二代—云与AI计算
第二代架构使IT机架负载能力突破第一代架构限制,实际负载可达100kW级别。一旦所需的总功率开始达到200kW左右,配电损耗就会显著增加,导致进一步提升功率变得不切实际。
AI数据中心电力输送
负责运行高级AI模型的数据中心机架预计在2028年前突破1MW功率。假设汇流条电压为50V,在第二代架构中配送这一功率需要产生20,000A的电流。输送如此大电流所需的汇流条将会很重、成本高昂且不切实际。因此,新型AI IT服务器机架采用800VDC或±400VDC的更高电压总线进行配电,可以将汇流排的大电流要求从20kA降低到1.25kA。这种量级的电流降低将有助于保持较高的整体电力输送效率,并支持使用体积更小、密度更低的铜汇流排。图4展示了这一架构。
第二代架构的电源架被侧装式电源舱取代,侧装式电源舱将三相480VAC电网电压作为其输入。侧装式电源舱将此输入转换为800VDC或±400VDC总线电压并配送到一个或多个IT服务器机架。侧装式电源舱现在还包括BBU。除了提高配电效率,第三代架构还在IT机架中为计算功能提供了更多空间。
从某种意义上讲,提升IT服务器机架的计算密度比解决配电问题更为关键。为了让AI发挥最佳功能,基于AI的IT机架会使用数百个处理器来快速处理所需的计算量。这些AI处理器需要能够在高密度的封装空间中相互通信。从IT机架中移除大部分电源转换功能后,可以在更小的空间内安装更多的AI处理器。现在,机架中的每个IT托盘都以此800VDC或±400VDC总线电压作为输入。然后,托盘中的中间总线转换器将该电压转换为IT托盘上的配电电压。根据所选架构,配电电压可以是48V、12V甚至6V。

图4. 第三代—AI计算直流配电侧装式电源舱
未来将如何发展?
尽管第三代架构可以提升配电效率并显著增加IT机架内的计算密度,但这样做的代价是会占用数据中心IT机房的更多空间。因此,数据中心演进的下一步是将侧装式电源舱的AC/DC电源转换功能从IT机房迁移至配电室。
图5展示了第四代架构的规划方案。在此架构中,侧装式电源舱保留BBU功能,而AC/DC转换功能则移入固态变压器(SST)。第一、二、三代架构的输入电压均为电网提供的13kV中压。该电压被变压为三相480VAC配电总线电压,然后转换为直流配电总线电压。SST同时取代了13kV变压器和480VDC至800VDC或±400VDC电源转换环节。SST在单个电力转换阶段实现PFC功能、电压降压和直流转换。备用发电机现在需要连接至中压节点,或通过AC/DC转换器接入SST输出端。最终实现了更高效的配电网络,并为IT机房腾出更多计算空间。

图5. 第四代—AI计算SST与直流配电
实现愿景的技术支撑
每一代配电架构都需要大量的精密电源转换功能。这些功能包括PFC、800VDC或±400VDC DC/DC转换、二极管ORing、均流、热插拔、保护、控制及功率计量。先进半导体技术是确保各项功能实现极致性能与效率的关键。例如:
• 执行PFC并生成直流总线电压需要实时微控制器。
• 实现电感器-电感器-电容器(LLC)和PFC等拓扑需要高效的宽带隙半导体开关。
• 支持功率计量、控制与保护需要精确的电流和电压检测。
• 为系统内各种隔离式开关供电需要小尺寸、高效的偏置电源和栅极驱动器。
结语
AI正在改变我们与信息和数据的交互方式。为了满足电力转换需求,数据中心亟需新型配电架构。本系列的后续文章将深入解析PSU,探讨储能,分析中间总线转换器与电压稳压器的发展趋势,以及阐释支撑这些功能的主要技术和半导体解决方案。
暂无评论