GenAI的驚人速度正在重塑半導(dǎo)體行業(yè)
人類正在目睹一場(chǎng)如此極端的技術(shù)革命,其全部規(guī)??赡艹鑫覀兊闹橇Ψ秶?。生成式 AI (GenAI) 的性能每六個(gè)月翻一番 [1],超過了業(yè)界所說的超級(jí)摩爾定律的摩爾定律。一些云 AI 芯片制造商預(yù)計(jì)未來十年每年的性能將翻倍或翻三倍 [2]。在這個(gè)由三部分組成的博客系列中,我們將探討當(dāng)今的半導(dǎo)體格局和創(chuàng)新芯片制造商戰(zhàn)略,在第二部分深入探討未來的重大挑戰(zhàn),并在第三部分通過研究推動(dòng) AI 未來的新興變化和技術(shù)來結(jié)束。
按照這種爆炸性的速度,專家預(yù)測(cè)通用人工智能 (AGI) 將在 2030 年左右實(shí)現(xiàn) [3][4],緊隨其后的是人工智能超級(jí)智能 (ASI) [5]。AGI 將擁有類似人類的推理能力,而 ASI 將超越它,重新編程自己,即使是最專業(yè)的頭腦也無法理解。AGI 通過自我修飾迅速演變?yōu)?ASI,俗稱智能爆炸。
下圖使這種指數(shù)加速度不容忽視。在短短幾年內(nèi),AI 在許多曾經(jīng)被認(rèn)為需要深厚專業(yè)知識(shí)的復(fù)雜任務(wù)中超越了人類的表現(xiàn)。它還迅速接近其他領(lǐng)域,例如推理、數(shù)學(xué)問題解決和代碼生成。幾十年停滯不前的功能現(xiàn)在只需幾個(gè)月即可實(shí)現(xiàn)飛躍。如果保持這種速度,AI 將很快在幾乎所有認(rèn)知領(lǐng)域都超過人類,將 AGI 從理論變?yōu)楸厝弧?/p>
?
比較 AI 和人類在不同領(lǐng)域的能力。當(dāng) AI 的性能越過零線時(shí),它的得分比人類高 [6]。
這種快速發(fā)展對(duì)半導(dǎo)體行業(yè)的影響是深遠(yuǎn)的,因?yàn)?GenAI 正在推動(dòng)對(duì)支持訓(xùn)練和推理的高級(jí)云 SoC 的強(qiáng)勁需求。分析師預(yù)測(cè),到 2030 年,這一專業(yè)領(lǐng)域?qū)⒔咏?3000 億美元,復(fù)合年增長(zhǎng)率接近 33% [7]。
這種激增的需求打破了關(guān)于半導(dǎo)體市場(chǎng)變化速度的舊假設(shè),GenAI 的快速發(fā)展證明他們可以在一夜之間顛覆它。該圖表顯示,生成式 AI 在兩年內(nèi)達(dá)到了 PC 需要近十年才能達(dá)到的采用水平,甚至比智能手機(jī)、平板電腦 [8] 和互聯(lián)網(wǎng)還要快。
生成式 AI 的采用率超過了早期的 PC 和互聯(lián)網(wǎng)使用量,因?yàn)?39.4% 的 18-64 歲美國(guó)人報(bào)告在 ChatGPT(生成式預(yù)訓(xùn)練轉(zhuǎn)換器)發(fā)布后的兩年內(nèi)使用它 [9],使其成為歷史上增長(zhǎng)最快的技術(shù) [10]。
地緣政治進(jìn)一步放大了這些市場(chǎng)震動(dòng)。美中科技競(jìng)爭(zhēng)已將半導(dǎo)體變成兩個(gè)超級(jí)大國(guó)軍備競(jìng)賽的戰(zhàn)略資產(chǎn)。美國(guó)實(shí)施了廣泛的出口限制,阻止中國(guó)獲得美國(guó)的人工智能處理器,旨在減緩其實(shí)現(xiàn) AGI 的進(jìn)展 [11]。中國(guó)正在通過顛覆性舉措進(jìn)行反擊,例如開源 DeepSeek-R1,由于美國(guó)的芯片限制,該芯片是使用早期芯片構(gòu)建的。
實(shí)現(xiàn)產(chǎn)量最大化的多樣化芯片制造商策略
下表匯編了幾款領(lǐng)先的 AI 芯片的最新規(guī)格。所有數(shù)字均基于單芯片,而不是多芯片系統(tǒng),例如 NVIDIA 的 GB200 NVL4。僅包含發(fā)布時(shí)可用的芯片。
這些數(shù)據(jù)提供了一個(gè)高層次的概述,而不是嚴(yán)格的同類比較,后者需要在相同的工作負(fù)載和條件下測(cè)試所有芯片。每瓦性能 (PPW) 是通過計(jì)算 (PFLOPS?1000)/瓦特 (PFLOPS·1000)/瓦特來推導(dǎo)出的,但一些芯片制造商并未公開披露瓦數(shù)(參見下面的 N/A)。
該表的構(gòu)建主要依賴于官方供應(yīng)商規(guī)范和信譽(yù)良好的第三方來源。在少數(shù)情況下,會(huì)推斷值,例如根據(jù) 8 位浮點(diǎn) (FP8) Peta 每秒浮點(diǎn)運(yùn)算數(shù) (PFLOPS) 估計(jì) 16 位浮點(diǎn) (FP16) 性能。
市場(chǎng)上一些最受歡迎的云 AI 加速器的鳥瞰圖。*片上 SRAM,與其他使用片外 HBM 的芯片不同。
像這樣并排比較所有供應(yīng)商,揭示了 AI 加速器設(shè)計(jì)中的不同策略:
NVIDIA 和 AMD 憑借基于 GPU 的架構(gòu)和海量 HBM 內(nèi)存帶寬占據(jù)主導(dǎo)地位。
AWS、Google 和 Microsoft 依賴于針對(duì)其數(shù)據(jù)中心優(yōu)化的定制芯片。
Cerebras 和 Groq 推動(dòng)了新型架構(gòu),如晶圓級(jí)芯片和數(shù)據(jù)流執(zhí)行。例如,Cerebras 從單個(gè)芯片提供 125 PFLOPS 和 21 PB/s 帶寬。同時(shí),Groq 強(qiáng)調(diào)超低延遲的數(shù)據(jù)流路徑,以減少推理延遲。
生成式 AI 的加速發(fā)展不僅改變了技術(shù),還重塑了半導(dǎo)體行業(yè)并加劇了地緣政治緊張局勢(shì)。隨著芯片制造商競(jìng)相提供前所未有的處理能力和效率,所部署的策略多種多樣且具有創(chuàng)新性,但挑戰(zhàn)卻是深遠(yuǎn)的。這種快速進(jìn)展伴隨著重大障礙,尤其是對(duì)于基于云的 AI 部署,其中有效和可持續(xù)地?cái)U(kuò)展變得越來越復(fù)雜。
引用
薩蘭,C.(2024 年)。Microsoft Ignite:AI 功能每六個(gè)月翻一番
黃 J. (2024)。NVIDIA 首席執(zhí)行官黃仁勛預(yù)測(cè) AI 將以“超級(jí)摩爾定律”的速度發(fā)展。巴倫周刊。
阿莫迪,D.(2024 年)。Anthropic Chief:到明年,AI 可能比所有人類都更聰明。泰晤士報(bào)。
庫(kù)茲韋爾,R.(2024 年)。AI 領(lǐng)導(dǎo)者討論該技術(shù)的變革潛力。時(shí)間。
戈策爾,B.(2024 年)。人工智能超級(jí)智能可能在 2027 年到來。未來主義。
Kiela, D., Thrush, T., Ethayarajh, K., & Singh, A. (2023)。在 AI 中繪制進(jìn)度。情境化 AI 博客。
下一步戰(zhàn)略咨詢。(2025). 人工智能 (AI) 芯片市場(chǎng)報(bào)告。
內(nèi)幕情報(bào)。(2023). 生成式 AI 的采用速度比智能手機(jī)和平板電腦攀升得更快。eMarketer 的
圣路易斯聯(lián)邦儲(chǔ)備銀行。(2024). 生成式 AI 的快速采用。
福布斯。(2023). 突然人工智能:歷史上采用最快的商業(yè)技術(shù)。
卡奇瓦拉,Z.(2025 年)。NVIDIA 面臨美國(guó) AI 芯片新出口限制的收入威脅。路透社。
評(píng)論