從48V到800V:數(shù)據(jù)中心高壓直流電源的嚴(yán)峻挑戰(zhàn)
數(shù)據(jù)中心(特別是那些推動(dòng) AI 最新創(chuàng)新的數(shù)據(jù)中心)正在消耗越來越多的電力。高盛 (Goldman Sachs) 目前的研究表明,數(shù)據(jù)中心消耗了當(dāng)今全球 2% 的電力,預(yù)計(jì)到 2030 年,這一數(shù)字將增加到 10%。
本文引用地址:http://www.bjwjmy.cn/article/202505/470557.htm這暴露了數(shù)據(jù)中心傳統(tǒng)電力電子設(shè)備的缺點(diǎn),從為服務(wù)器柱提供交流電的配電系統(tǒng),到提供直流電源的穩(wěn)壓器,再到作為這一切核心的高性能 AI 芯片。數(shù)據(jù)中心的電源架構(gòu)必須進(jìn)行重大變革,以應(yīng)對(duì) AI 不斷增長(zhǎng)的電源需求,反過來,電子設(shè)計(jì)人員將不得不解決許多挑戰(zhàn)。
代溝:數(shù)據(jù)中心供電的演變
要了解數(shù)據(jù)中心電源的發(fā)展方向,現(xiàn)在了解電源架構(gòu)的構(gòu)建非常重要。圖 1 顯示了您可以稱為“第一代”電源架構(gòu)的主要構(gòu)建塊。在這種情況下,三相交流電(通常為 480 V 線對(duì)線電壓)進(jìn)入數(shù)據(jù)中心并為不間斷電源 (UPS) 供電。UPS 支持備用電池,并有助于為服務(wù)器機(jī)架提供穩(wěn)定的交流電壓。在服務(wù)器機(jī)架內(nèi)部,使用每個(gè)服務(wù)器刀片中的通用冗余電源將交流電壓整流并降至 12 V。
1. 數(shù)據(jù)中心第一代 Power Architecture。
幾十年來,這種架構(gòu)一直是數(shù)據(jù)中心供電的行業(yè)標(biāo)準(zhǔn),如今的大部分系統(tǒng)仍然采用這種配置。這種架構(gòu)中的典型服務(wù)器機(jī)架將支持 10 到 15 kW 的功率。
大約十年前,整個(gè)技術(shù)行業(yè)開始推動(dòng)提高數(shù)據(jù)中心的效率。巨大的云數(shù)據(jù)中心的興起有助于提高功率水平,這導(dǎo)致了“第二代”架構(gòu)的出現(xiàn)(圖 2)。
2. 升級(jí)到 48 V 總線的第二代電源架構(gòu)與 12V 相比,總電流降低了 4 倍,功率損耗降低了 16 倍。
這個(gè)新系統(tǒng)與第一代有幾個(gè)不同。服務(wù)器電源的輸出電壓增加到 48 V,同時(shí)將電源整合到電源架中,也稱為“開放式機(jī)架”電源。機(jī)架中還集成了本地備用電池單元。
所有這些改進(jìn)都使功率轉(zhuǎn)換級(jí)的效率提高了 5%,同時(shí)增加了可交付的功率。在云計(jì)算數(shù)據(jù)中心中,典型的機(jī)架將具有 40 kW 到超過 100 kW 的功率。
但是,隨著耗電的 AI 芯片開始在數(shù)據(jù)中心占據(jù)主導(dǎo)地位,第二代架構(gòu)正在達(dá)到其物理極限。AI 數(shù)據(jù)中心的單個(gè)機(jī)架功率需求攀升至 600 kW 至 1 MW。如今,AI 工作負(fù)載需要大量的計(jì)算,這需要縮短圖形處理單元 (GPU)、中央處理器 (CPU) 和網(wǎng)絡(luò)交換機(jī)之間的物理連接距離。這種配置意味著大而笨重的電源需要從 IT 機(jī)架中移出。
這就是為什么第三代架構(gòu)引入了 sidecar 的概念,它基本上是一個(gè)單獨(dú)的機(jī)架,僅用于通過母線連接連接到服務(wù)器機(jī)架的電源(圖 3)。
3. 隨著 AI 處理器突破當(dāng)今數(shù)據(jù)中心的功率極限,科技公司正在將 AC-DC 電源重新安置到單獨(dú)的電源機(jī)架或 sidecar 中。
數(shù)據(jù)中心高壓直流電源的設(shè)計(jì)挑戰(zhàn)
現(xiàn)在我們已經(jīng)回顧了未來數(shù)據(jù)中心的發(fā)展方向,我們可以討論高壓直流配電的挑戰(zhàn)和一些潛在的解決方案。電源設(shè)計(jì)人員和系統(tǒng)工程師需要問自己一長(zhǎng)串問題,其中一些我們甚至可能還沒有考慮過。但這里有幾個(gè)需要關(guān)注:
最佳輸出電壓電平是多少?+400 V、+800 V、±400 V?
隔離在系統(tǒng)中的作用是什么?高壓輸出是否絕對(duì)必要?
適合 sidecar 的電源轉(zhuǎn)換拓?fù)溆心男??那么在服?wù)器機(jī)架中呢?
如果將電源移出 IT 機(jī)架的主要?jiǎng)訖C(jī)是提高計(jì)算密度,為什么必須更改電源的輸出電壓呢?簡(jiǎn)單的答案與將電力從 sidecar 輸送到 IT 機(jī)架的母線有關(guān)。如果服務(wù)器機(jī)架需要 600 kW 的功率來運(yùn)行計(jì)算密集型工作負(fù)載,例如 AI 訓(xùn)練和推理,則需要 12500 A 的電流(不考慮任何傳輸損耗)才能在 48 V 下提供該功率。
由于所需的電流密度,該母線排的物理尺寸將非常大,重量接近 200 磅。這些母線排還需要液體冷卻,從而增加了成本和復(fù)雜性。相反,如果將配電電壓提高到 800 V DC,則 600 kW 機(jī)架只需要 750 A 的電流。該電流水平將允許空氣冷卻,并將每個(gè)母線排的重量減輕 85%。
配電電壓必須增加 — 這一點(diǎn)很清楚。但是什么是正確的電壓電平?+400V、+800V 或 ±400V 電壓電平已用于當(dāng)今的電動(dòng)汽車 (EV) 和相關(guān)充電基礎(chǔ)設(shè)施。
+400 V 電壓非常有意義,因?yàn)樗呀?jīng)在當(dāng)今的數(shù)據(jù)中心中得到廣泛應(yīng)用:大多數(shù)單相 AC-DC 電源中的功率因數(shù)校正 (PFC) 級(jí)在 LLC 級(jí)將其降壓至 48 V 或 12 V 之前輸出 +400 V,并且電氣元件隨時(shí)可用。工程師還從安全角度對(duì) 400 V 以及設(shè)計(jì)中的爬電距離和間隙間距有深入的了解。但是,如果功率水平增加得更多,母線可能會(huì)成為一個(gè)問題。
+800 V 電平是總線電壓的另一個(gè)可行選項(xiàng),因?yàn)樗鼘⒃试S更小的母線和更高的配電效率。不過,這是一個(gè)相對(duì)較新的組件生態(tài)系統(tǒng)。工程師將不得不解決一系列有關(guān)安全性和間距的技術(shù)問題。第三個(gè)選項(xiàng)是將前兩個(gè)選項(xiàng)組合在一起,然后選擇 ±400 V。它的主要缺點(diǎn)是該電壓需要復(fù)雜的控制以確保負(fù)載平衡。
隔離:如何在高壓直流電源系統(tǒng)中處理
考慮所有三個(gè)電壓選項(xiàng)很重要,但另一個(gè)問題會(huì)影響您的選擇:隔離。
隔離和絕緣有兩個(gè)目的:一個(gè)是確保最終用戶的安全,另一個(gè)是保持接地回路分離。這兩者都對(duì)于數(shù)據(jù)中心架構(gòu)非常重要。由于所需的功率水平,最好并聯(lián)多個(gè)較小的電源,確保這些電源共享電流。
圖 4 說明了輸出電壓和隔離方案的幾個(gè)選項(xiàng)。第一種選擇是最直接的選擇,因?yàn)樗婕皩?PFC 級(jí)變成單獨(dú)的電源單元 (PSU)。盡管它有優(yōu)勢(shì),但公司是否會(huì)接受它仍然存在不確定性。當(dāng)并聯(lián)多個(gè)非隔離式 AC-DC 電源時(shí),還存在電流共享和平衡問題。與具有額外隔離級(jí)的其他選項(xiàng)相比,第一個(gè)選項(xiàng)提供最高效率和最低成本。
4. 顯示了高壓直流電源架構(gòu)中的不同隔離方法。
第二個(gè)、第三個(gè)和第四個(gè)選項(xiàng)在 AC-DC 級(jí)之后引入隔離,以解決電流平衡問題。第三種和第四種選擇使用分離式軌產(chǎn)生 ±400 V,主要區(qū)別在于所需的母線數(shù)量(3 對(duì) 2)。第四個(gè)選項(xiàng)需要一些額外的控制,以確保 ±400 V 上的負(fù)載平衡。
電源拓?fù)洌浩胶獬杀?、速度、效率和隔離
另一個(gè)決定涉及 AC-DC 整流器使用什么拓?fù)?。許多因素都會(huì)驅(qū)動(dòng)拓?fù)涞倪x擇,包括成本、效率、負(fù)載瞬態(tài)和隔離。
兩級(jí)方法,其中一級(jí)處理整流器,另一級(jí)管理隔離,是設(shè)計(jì)電源系統(tǒng)最傳統(tǒng)和最流行的方法。整流器有許多眾所周知的拓?fù)浣Y(jié)構(gòu),例如 Vienna 整流器、T 型逆變器或有源中性點(diǎn)鉗位。
同樣,隔離式 DC-DC 級(jí)(例如三相 LLC 或全橋 LLC)可用于實(shí)現(xiàn)穩(wěn)壓和隔離。這種方法的一大優(yōu)點(diǎn)是,通過在整流器和隔離式 DC-DC 級(jí)之間增加額外的電容,能夠輕松處理瞬態(tài)和線路壓降事件的能量存儲(chǔ)。
另一種可能的方法是使用單級(jí)來處理 AC-DC 整流和隔離。這也稱為矩陣轉(zhuǎn)換器。圖 5 顯示了單級(jí)矩陣轉(zhuǎn)換器的簡(jiǎn)化原理圖。
德州儀器 (TI)5. 用于單級(jí)絕緣 AC-DC 電源的矩陣轉(zhuǎn)換器內(nèi)部。
這種類型的轉(zhuǎn)換器可以通過減少導(dǎo)通路徑中的開關(guān)數(shù)量以及縮小開關(guān)和磁性元件的總數(shù)來提高效率,從而降低成本。不過,除了對(duì)浪涌電壓的擔(dān)憂外,在儲(chǔ)能方面還出現(xiàn)了一些潛在的缺點(diǎn)。
矩陣轉(zhuǎn)換器也是雙向開關(guān)的完美應(yīng)用,有助于降低成本并進(jìn)一步提高效率。盡管如此,要實(shí)現(xiàn)這種類型的設(shè)計(jì),必須解決許多問題和技術(shù)細(xì)節(jié)。
向高壓直流配電的轉(zhuǎn)變必將給數(shù)據(jù)中心電源帶來許多變化。解決復(fù)雜問題和改進(jìn)電源的機(jī)會(huì)正在發(fā)生。為了滿足新處理器的電源需求,未來的數(shù)據(jù)中心將依賴于今天做出的決策。
評(píng)論