Nvidia將數(shù)據(jù)中心統(tǒng)一為千兆規(guī)模的AI工廠
隨著人工智能需求的激增,單個(gè)數(shù)據(jù)中心正在達(dá)到單個(gè)設(shè)施內(nèi)的功率和容量極限。為了擴(kuò)展,數(shù)據(jù)中心必須擴(kuò)展到任何一棟建筑之外,而任何一棟建筑都受到現(xiàn)成的以太網(wǎng)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的限制,具有高延遲和抖動(dòng)以及不可預(yù)測(cè)的性能。
Spectrum-XGS 以太網(wǎng)添加到 NVIDIA Spectrum-X 以太網(wǎng)平臺(tái)中,該平臺(tái)通過引入跨擴(kuò)展基礎(chǔ)設(shè)施消除了這些界限。它是 AI 計(jì)算的第三大支柱,超越縱向擴(kuò)展和橫向擴(kuò)展,旨在擴(kuò)展 Spectrum-X 以太網(wǎng)的極致性能和規(guī)模,以互連多個(gè)分布式數(shù)據(jù)中心,形成能夠?qū)崿F(xiàn)千兆級(jí)智能的 AI 超級(jí)工廠。
“人工智能工業(yè)革命已經(jīng)到來,大規(guī)模人工智能工廠是必不可少的基礎(chǔ)設(shè)施,”首席執(zhí)行官黃仁勛說,“借助 NVIDIA Spectrum-XGS 以太網(wǎng),我們?cè)黾恿丝v向擴(kuò)展和橫向擴(kuò)展功能,將跨城市、國(guó)家和大陸的數(shù)據(jù)中心連接成巨大的千兆級(jí)人工智能超級(jí)工廠。
Spectrum-XGS 以太網(wǎng)集成到 Spectrum-X 平臺(tái)中,其算法可使網(wǎng)絡(luò)適應(yīng)數(shù)據(jù)中心設(shè)施之間的距離。
憑借先進(jìn)的自動(dòng)調(diào)整距離擁塞控制、精確的延遲管理和端到端遙測(cè),Spectrum-XGS 以太網(wǎng)將 NVIDIA 集體通信庫(kù)的性能提高了近一倍,加速了多 GPU 和多節(jié)點(diǎn)通信,從而在地理分布的 AI 集群中提供可預(yù)測(cè)的性能。因此,多個(gè)數(shù)據(jù)中心可以作為單個(gè) AI 超級(jí)工廠運(yùn)行,并針對(duì)長(zhǎng)距離連接進(jìn)行了全面優(yōu)化。
采用新基礎(chǔ)設(shè)施的超大規(guī)模先驅(qū)包括 CoreWeave,它將成為首批將其數(shù)據(jù)中心與 Spectrum-XGS 以太網(wǎng)連接的公司之一。
Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái)為多租戶、超大規(guī)模 AI 工廠(包括世界上最大的 AI 超級(jí)計(jì)算機(jī))提供比現(xiàn)成以太網(wǎng)高 1.6 倍的帶寬密度。
它包括 NVIDIA Spectrum-X 交換機(jī)和 NVIDIA ConnectX-8 SuperNIC,為構(gòu)建人工智能未來的企業(yè)提供可擴(kuò)展性、低延遲和性能。
該公告是在 NVIDIA 發(fā)布多項(xiàng)網(wǎng)絡(luò)創(chuàng)新公告之后發(fā)布的,包括 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光子網(wǎng)絡(luò)交換機(jī),它們使 AI 工廠能夠跨站點(diǎn)連接數(shù)百萬個(gè) GPU,同時(shí)降低能耗和運(yùn)營(yíng)成本
評(píng)論