英偉達(dá)H20芯片解禁!還將推出新款中國(guó)特供版GPU
7月14日,英偉達(dá)新聞室發(fā)布恢復(fù)向中國(guó)銷售H20芯片,并宣布推出全新完全合規(guī)的中國(guó)特供版GPU。
黃仁勛還向客戶更新了最新進(jìn)展,指出英偉達(dá)正在重新提交銷售H20 GPU的申請(qǐng),美國(guó)政府已向英偉達(dá)保證將發(fā)放許可證,公司希望盡快開始交付。最后,黃仁勛宣布推出一款全新完全合規(guī)的RTX PRO GPU,稱其“是智能工廠和物流領(lǐng)域數(shù)字孿生人工智能應(yīng)用的理想選擇”。
H20芯片是英偉達(dá)為繞過美國(guó)出口管制、專門為中國(guó)市場(chǎng)定制的“降配版”AI加速器,雖性能不及H100或B100,但仍遠(yuǎn)超大多數(shù)國(guó)產(chǎn)GPU,且在大模型訓(xùn)練和推理場(chǎng)景中擁有實(shí)戰(zhàn)價(jià)值。4月,美國(guó)政府叫停專為中國(guó)市場(chǎng)研發(fā)的H20芯片出口許可,導(dǎo)致英偉達(dá)超百億美元的損失。黃仁勛曾多次強(qiáng)調(diào)中國(guó)市場(chǎng)的重要性。根據(jù)英偉達(dá)最新的年度報(bào)告,在截至2024年1月26日的財(cái)年中,中國(guó)市場(chǎng)為其創(chuàng)造了170億美元的營(yíng)收,占其總銷售額的13%,是英偉達(dá)實(shí)現(xiàn)增長(zhǎng)的關(guān)鍵市場(chǎng)。
有消息稱,H20替代版B30在性能再度縮水之后將于9月發(fā)售,其FP16性能大致在80出頭,F(xiàn)P8接近200出頭,互連帶寬約為1.5–1.6TB。從整體性能看,B30顯然并不適合用于訓(xùn)練,雖然H20勉強(qiáng)還能用于訓(xùn)練(比如靠?jī)?nèi)存解決方案、FP8精度以及傳統(tǒng)方法),尚非完全不可行,但B30的訓(xùn)練能力較弱。在模型推理方面,例如圖像、語(yǔ)音等當(dāng)前主要應(yīng)用,可能還有部分文本模塊推理,B30具備一定確定性,尤其是未來整合多模態(tài)處理(圖像、語(yǔ)音、視頻)等方向上。
值得注意的是,隨著機(jī)架式方案逐漸出現(xiàn),類似互連架構(gòu)的推理部署方案成為一個(gè)不錯(cuò)的選項(xiàng),但是GB30的情況尚不明確,機(jī)架式方案的實(shí)際推進(jìn)時(shí)間也未可知,仍存在較多不確定性。目前最合理的方向,仍是推動(dòng)算力租賃,如果算力租賃全面放開,將是未來公司算力供給架構(gòu)的重大轉(zhuǎn)變。
因而,對(duì)比B30的不確定性,一旦H20確認(rèn)出口放行,不僅將為英偉達(dá)在華業(yè)務(wù)打開重要缺口,為英偉達(dá)業(yè)績(jī)?cè)鲩L(zhǎng)帶來強(qiáng)勁動(dòng)能,還可緩解中國(guó)AI大模型企業(yè)的算力焦慮。
評(píng)論