熟女俱乐部五十路二区av,又爽又黄禁片视频1000免费,国产卡一卡二卡三无线乱码新区,中文无码一区二区不卡αv,中文在线中文a

新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 谷歌在一年內(nèi)將人工智能查詢的能源成本降低了 33 倍

谷歌在一年內(nèi)將人工智能查詢的能源成本降低了 33 倍

作者: 時(shí)間:2025-08-26 來(lái)源: 收藏

今年到目前為止,美國(guó)的用電量與去年同期相比增長(zhǎng)了近 4%。這是在幾十年基本上持平使用之后發(fā)生的,這一變化與數(shù)據(jù)中心的快速擴(kuò)張有關(guān)。其中許多數(shù)據(jù)中心的建設(shè)是為了服務(wù)使用的蓬勃發(fā)展。鑒于煤炭使用量的增加滿足了部分不斷增長(zhǎng)的需求(截至 5 月,煤炭的發(fā)電份額比前一年增長(zhǎng)了約 20%),對(duì)環(huán)境的影響看起來(lái)相當(dāng)糟糕。

但是,如果不訪問(wèn)只有通過(guò)運(yùn)行數(shù)據(jù)中心才能獲得的各種詳細(xì)信息,例如硬件的使用頻率以及它提供 AI 的頻率,就很難確定。因此,雖然學(xué)術(shù)界可以測(cè)試單個(gè)模型的功耗需求,但很難將其推斷到現(xiàn)實(shí)世界的用例中。

相比之下,擁有來(lái)自實(shí)際用例的各種數(shù)據(jù)。因此,它發(fā)布的人工智能環(huán)境影響新分析是一個(gè)難得的機(jī)會(huì),可以窺探一下幕后的情況。但新的分析表明,能源估算目前是一個(gè)不斷變化的目標(biāo),因?yàn)樵摴颈硎?,其?shù)據(jù)顯示,僅在過(guò)去一年中,搜索的能源消耗就下降了 33 倍。

有什么進(jìn)的,什么出的

進(jìn)行這些分析時(shí)的一個(gè)大問(wèn)題是要包括什么。顯然,處理器在處理請(qǐng)求時(shí)消耗了大量能量。但支持這些處理器所需的內(nèi)存、存儲(chǔ)、冷卻等所需的能量也需要。除此之外,還有用于制造所有這些硬件和建造容納它們的設(shè)施的能源。人工智能在訓(xùn)練過(guò)程中還需要大量能量,其中一小部分可能計(jì)入訓(xùn)練后對(duì)模型發(fā)出的任何單個(gè)請(qǐng)求。

任何對(duì)能源使用的分析都需要決定要考慮哪些因素。對(duì)于過(guò)去所做的許多研究,各種因素被跳過(guò),主要是因?yàn)閳?zhí)行分析的人員無(wú)法訪問(wèn)相關(guān)數(shù)據(jù)。他們可能不知道需要多少處理器專門用于給定任務(wù),更不用說(shuō)與生產(chǎn)它們相關(guān)的碳排放了。

幾乎可以訪問(wèn)所有東西:用于處理請(qǐng)求的能源、執(zhí)行此請(qǐng)求所需的硬件、冷卻要求等等。而且,由于跟蹤因公司活動(dòng)(直接,通過(guò)發(fā)電等方式,或通過(guò)供應(yīng)鏈間接)產(chǎn)生的范圍 2 和范圍 3 排放正在成為標(biāo)準(zhǔn)做法,因此公司也可能獲得這些排放。

對(duì)于新的分析,跟蹤 CPU、專用 AI 加速器和內(nèi)存的能量,無(wú)論是在處理時(shí)處于活動(dòng)狀態(tài)還是在之間空閑時(shí)。它還跟蹤整個(gè)數(shù)據(jù)中心的能源和水使用情況,并了解該數(shù)據(jù)中心中還有什么,因此它可以估計(jì)用于提供 AI 查詢的比例。它還跟蹤與電力供應(yīng)相關(guān)的碳排放,以及其使用的所有硬件生產(chǎn)產(chǎn)生的排放。

三個(gè)主要因素沒(méi)有成功。一是用于接收請(qǐng)求和交付結(jié)果的網(wǎng)絡(luò)容量的環(huán)境成本,該成本將根據(jù)請(qǐng)求的不同而有很大差異。這同樣適用于最終用戶硬件上的計(jì)算負(fù)載;這將看到使用游戲臺(tái)式機(jī)的人和使用智能手機(jī)的人之間的巨大差異。谷歌本可以做出合理估計(jì)但沒(méi)有做出的一件事是訓(xùn)練其模型的影響。此時(shí),它將清楚地知道那里的,并且可能可以對(duì)訓(xùn)練模型的使用壽命和在此期間處理的請(qǐng)求數(shù)量做出合理的估計(jì)。但它沒(méi)有將其包含在目前的估計(jì)中。

為了得出典型數(shù)字,進(jìn)行分析的團(tuán)隊(duì)跟蹤了 24 小時(shí)內(nèi)為請(qǐng)求提供服務(wù)的硬件,以及該硬件的空閑時(shí)間。這為他們提供了每個(gè)請(qǐng)求的能量估計(jì)值,該估計(jì)值因所使用的模型而異。對(duì)于每一天,他們都會(huì)確定提示的中位數(shù),并使用它來(lái)計(jì)算環(huán)境影響。

下降

使用這些估計(jì),他們發(fā)現(xiàn)單個(gè)文本請(qǐng)求的影響非常小?!拔覀児烙?jì) Gemini Apps 文本提示的中位數(shù)使用 0.24 瓦時(shí)的能量,排放 0.03 克二氧化碳當(dāng)量 (gCO2e),并消耗 0.26 毫升(或約五滴)水,”他們總結(jié)道??紤]到這一點(diǎn),他們估計(jì)能源消耗類似于大約 9 秒的電視觀看時(shí)間。

壞消息是,請(qǐng)求量無(wú)疑非常高。該公司選擇對(duì)每個(gè)搜索請(qǐng)求執(zhí)行人工智能作,這是幾年前根本不存在的計(jì)算需求。因此,雖然個(gè)人影響很小,但累積成本可能是相當(dāng)可觀的。

好消息?就在一年前,情況會(huì)更糟得多。

其中一些只是取決于情況。隨著美國(guó)和其他地方太陽(yáng)能的蓬勃發(fā)展,谷歌安排可再生能源變得更加容易。因此,過(guò)去一年每單位能源消耗的碳排放量減少了 1.4 倍。但最大的勝利是在軟件方面,不同的方法使每個(gè)提示的能耗減少了 33 倍。

顯示不同硬件使用的能量百分比的顏色條。AI加速器的用途最大,其次是CPU和RAM。閑置機(jī)器和間接費(fèi)用各占 10% 左右。

處理 AI 請(qǐng)求的大部分能源消耗來(lái)自在定制加速器芯片上花費(fèi)的時(shí)間。 

1756170075191961.png

處理 AI 請(qǐng)求的大部分能源消耗來(lái)自在定制加速器芯片上花費(fèi)的時(shí)間

谷歌團(tuán)隊(duì)描述了該公司為此所做的一些優(yōu)化。一種是稱為“專家混合”的方法,它涉及弄清楚如何僅激活處理特定請(qǐng)求所需的人工智能模型部分,這可以將計(jì)算需求降低 10 到 100 倍。他們開發(fā)了許多主要模型的緊湊版本,這也減少了計(jì)算負(fù)載。數(shù)據(jù)中心管理也發(fā)揮著作用,因?yàn)楣究梢源_保任何活動(dòng)硬件都得到充分利用,同時(shí)允許其余硬件保持低功耗狀態(tài)。

另一件事是,谷歌設(shè)計(jì)了自己的定制人工智能加速器,并構(gòu)建了在其上運(yùn)行的軟件,使其能夠優(yōu)化硬件/軟件鴻溝的兩側(cè),使其能夠相互良好運(yùn)行。鑒于 AI 加速器上的活動(dòng)占查詢總能耗的一半以上,這一點(diǎn)尤為重要。谷歌在運(yùn)營(yíng)高效數(shù)據(jù)中心方面也擁有豐富的經(jīng)驗(yàn),這些經(jīng)驗(yàn)也延續(xù)到了人工智能方面的經(jīng)驗(yàn)。

所有這一切的結(jié)果是,它估計(jì)僅在去年一年,典型文本查詢的能耗就下降了 33 倍。這會(huì)產(chǎn)生連鎖反應(yīng),因?yàn)榕c構(gòu)建硬件相關(guān)的碳排放等問(wèn)題會(huì)被硬件在其使用壽命期間可以處理更多查詢這一事實(shí)所稀釋。

鑒于這些效率的提高,谷歌很容易簡(jiǎn)單地將結(jié)果用作公關(guān)活動(dòng);相反,該公司在讀起來(lái)非常像學(xué)術(shù)出版物的內(nèi)容中詳細(xì)介紹了其方法和考慮因素。它采取這種方法是因?yàn)檫@項(xiàng)工作背后的人希望看到該領(lǐng)域的其他人采用它的方法?!拔覀冎鲝垙V泛采用這種或類似的綜合測(cè)量框架,以確保隨著人工智能能力的進(jìn)步,它們的環(huán)境效率也會(huì)提高,”他們總結(jié)道。



關(guān)鍵詞: 谷歌 人工智能 查詢 能源成本

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉