新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > GenAI的驚人速度正在重塑半導(dǎo)體行業(yè)

GenAI的驚人速度正在重塑半導(dǎo)體行業(yè)

—— 對(duì)支持訓(xùn)練和推理的高級(jí)云 SoC 的強(qiáng)勁需求打破了關(guān)于半導(dǎo)體市場(chǎng)變化速度的假設(shè)。

作者：時(shí)間：2025-07-11 來(lái)源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

人類正在目睹一場(chǎng)如此極端的技術(shù)革命，其全部規(guī)?？赡艹鑫覀兊闹橇Ψ秶?。生成式 AI （GenAI）的性能每六個(gè)月翻一番 [1]，超過(guò)了業(yè)界所說(shuō)的超級(jí)摩爾定律的摩爾定律。一些云 AI 芯片制造商預(yù)計(jì)未來(lái)十年每年的性能將翻倍或翻三倍 [2]。在這個(gè)由三部分組成的博客系列中，我們將探討當(dāng)今的半導(dǎo)體格局和創(chuàng)新芯片制造商戰(zhàn)略，在第二部分深入探討未來(lái)的重大挑戰(zhàn)，并在第三部分通過(guò)研究推動(dòng) AI 未來(lái)的新興變化和技術(shù)來(lái)結(jié)束。

按照這種爆炸性的速度，專家預(yù)測(cè)通用人工智能（AGI）將在 2030 年左右實(shí)現(xiàn) [3][4]，緊隨其后的是人工智能超級(jí)智能（ASI） [5]。AGI 將擁有類似人類的推理能力，而 ASI 將超越它，重新編程自己，即使是最專業(yè)的頭腦也無(wú)法理解。AGI 通過(guò)自我修飾迅速演變?yōu)?ASI，俗稱智能爆炸。

下圖使這種指數(shù)加速度不容忽視。在短短幾年內(nèi)，AI 在許多曾經(jīng)被認(rèn)為需要深厚專業(yè)知識(shí)的復(fù)雜任務(wù)中超越了人類的表現(xiàn)。它還迅速接近其他領(lǐng)域，例如推理、數(shù)學(xué)問(wèn)題解決和代碼生成。幾十年停滯不前的功能現(xiàn)在只需幾個(gè)月即可實(shí)現(xiàn)飛躍。如果保持這種速度，AI 將很快在幾乎所有認(rèn)知領(lǐng)域都超過(guò)人類，將 AGI 從理論變?yōu)楸厝弧?/p>

?

比較 AI 和人類在不同領(lǐng)域的能力。當(dāng) AI 的性能越過(guò)零線時(shí)，它的得分比人類高 [6]。

這種快速發(fā)展對(duì)半導(dǎo)體行業(yè)的影響是深遠(yuǎn)的，因?yàn)?GenAI 正在推動(dòng)對(duì)支持訓(xùn)練和推理的高級(jí)云 SoC 的強(qiáng)勁需求。分析師預(yù)測(cè)，到 2030 年，這一專業(yè)領(lǐng)域?qū)⒔咏?3000 億美元，復(fù)合年增長(zhǎng)率接近 33% [7]。

這種激增的需求打破了關(guān)于半導(dǎo)體市場(chǎng)變化速度的舊假設(shè)，GenAI 的快速發(fā)展證明他們可以在一夜之間顛覆它。該圖表顯示，生成式 AI 在兩年內(nèi)達(dá)到了 PC 需要近十年才能達(dá)到的采用水平，甚至比智能手機(jī)、平板電腦 [8] 和互聯(lián)網(wǎng)還要快。

生成式 AI 的采用率超過(guò)了早期的 PC 和互聯(lián)網(wǎng)使用量，因?yàn)?39.4% 的 18-64 歲美國(guó)人報(bào)告在 ChatGPT（生成式預(yù)訓(xùn)練轉(zhuǎn)換器）發(fā)布后的兩年內(nèi)使用它 [9]，使其成為歷史上增長(zhǎng)最快的技術(shù) [10]。

地緣政治進(jìn)一步放大了這些市場(chǎng)震動(dòng)。美中科技競(jìng)爭(zhēng)已將半導(dǎo)體變成兩個(gè)超級(jí)大國(guó)軍備競(jìng)賽的戰(zhàn)略資產(chǎn)。美國(guó)實(shí)施了廣泛的出口限制，阻止中國(guó)獲得美國(guó)的人工智能處理器，旨在減緩其實(shí)現(xiàn) AGI 的進(jìn)展 [11]。中國(guó)正在通過(guò)顛覆性舉措進(jìn)行反擊，例如開(kāi)源 DeepSeek-R1，由于美國(guó)的芯片限制，該芯片是使用早期芯片構(gòu)建的。

實(shí)現(xiàn)產(chǎn)量最大化的多樣化芯片制造商策略

下表匯編了幾款領(lǐng)先的 AI 芯片的最新規(guī)格。所有數(shù)字均基于單芯片，而不是多芯片系統(tǒng)，例如 NVIDIA 的 GB200 NVL4。僅包含發(fā)布時(shí)可用的芯片。

這些數(shù)據(jù)提供了一個(gè)高層次的概述，而不是嚴(yán)格的同類比較，后者需要在相同的工作負(fù)載和條件下測(cè)試所有芯片。每瓦性能（PPW）是通過(guò)計(jì)算（PFLOPS?1000）/瓦特（PFLOPS·1000）/瓦特來(lái)推導(dǎo)出的，但一些芯片制造商并未公開(kāi)披露瓦數(shù)（參見(jiàn)下面的 N/A）。

該表的構(gòu)建主要依賴于官方供應(yīng)商規(guī)范和信譽(yù)良好的第三方來(lái)源。在少數(shù)情況下，會(huì)推斷值，例如根據(jù) 8 位浮點(diǎn) （FP8） Peta 每秒浮點(diǎn)運(yùn)算數(shù) （PFLOPS）估計(jì) 16 位浮點(diǎn) （FP16）性能。

市場(chǎng)上一些最受歡迎的云 AI 加速器的鳥(niǎo)瞰圖。*片上 SRAM，與其他使用片外 HBM 的芯片不同。

像這樣并排比較所有供應(yīng)商，揭示了 AI 加速器設(shè)計(jì)中的不同策略：

NVIDIA 和 AMD 憑借基于 GPU 的架構(gòu)和海量 HBM 內(nèi)存帶寬占據(jù)主導(dǎo)地位。

AWS、Google 和 Microsoft 依賴于針對(duì)其數(shù)據(jù)中心優(yōu)化的定制芯片。

Cerebras 和 Groq 推動(dòng)了新型架構(gòu)，如晶圓級(jí)芯片和數(shù)據(jù)流執(zhí)行。例如，Cerebras 從單個(gè)芯片提供 125 PFLOPS 和 21 PB/s 帶寬。同時(shí)，Groq 強(qiáng)調(diào)超低延遲的數(shù)據(jù)流路徑，以減少推理延遲。

生成式 AI 的加速發(fā)展不僅改變了技術(shù)，還重塑了半導(dǎo)體行業(yè)并加劇了地緣政治緊張局勢(shì)。隨著芯片制造商競(jìng)相提供前所未有的處理能力和效率，所部署的策略多種多樣且具有創(chuàng)新性，但挑戰(zhàn)卻是深遠(yuǎn)的。這種快速進(jìn)展伴隨著重大障礙，尤其是對(duì)于基于云的 AI 部署，其中有效和可持續(xù)地?cái)U(kuò)展變得越來(lái)越復(fù)雜。

引用

薩蘭，C.（2024 年）。Microsoft Ignite：AI 功能每六個(gè)月翻一番
黃 J. （2024）。NVIDIA 首席執(zhí)行官黃仁勛預(yù)測(cè) AI 將以“超級(jí)摩爾定律”的速度發(fā)展。巴倫周刊。
阿莫迪，D.（2024 年）。Anthropic Chief：到明年，AI 可能比所有人類都更聰明。泰晤士報(bào)。
庫(kù)茲韋爾，R.（2024 年）。AI 領(lǐng)導(dǎo)者討論該技術(shù)的變革潛力。時(shí)間。
戈策爾，B.（2024 年）。人工智能超級(jí)智能可能在 2027 年到來(lái)。未來(lái)主義。
Kiela， D.， Thrush， T.， Ethayarajh， K.， & Singh， A. （2023）。在 AI 中繪制進(jìn)度。情境化 AI 博客。
下一步戰(zhàn)略咨詢。（2025）. 人工智能（AI）芯片市場(chǎng)報(bào)告。
內(nèi)幕情報(bào)。（2023）. 生成式 AI 的采用速度比智能手機(jī)和平板電腦攀升得更快。eMarketer 的
圣路易斯聯(lián)邦儲(chǔ)備銀行。（2024）. 生成式 AI 的快速采用。
福布斯。（2023）. 突然人工智能：歷史上采用最快的商業(yè)技術(shù)。
卡奇瓦拉，Z.（2025 年）。NVIDIA 面臨美國(guó) AI 芯片新出口限制的收入威脅。路透社。