3D器件堆棧的新型組裝方法
半導(dǎo)體封裝的下一個重大飛躍將需要一系列新技術(shù)、工藝和材料,但總的來說,它們將使性能得到數(shù)量級的提高,這對于 AI 時代至關(guān)重要。
并非所有這些問題都得到完全解決,但最近的電子元件技術(shù)會議 (ECTC) 讓我們得以一窺自 ChatGPT 的推出震驚科技界以來,過去幾年所取得的巨大飛躍。AMD、TSMC、Samsung、Intel 和許多設(shè)備供應(yīng)商詳細(xì)介紹了混合鍵合、玻璃芯基板、微通道或直接冷卻冷卻以及通過背面電源方案散熱方面的改進(jìn)。
“AI 改變超級計算機(jī)/高性能計算空間的方式令人驚嘆,”AMD 高級副總裁兼企業(yè)研究員 Sam Naffziger 在關(guān)于 AI 計算的演講中表示?!癈hatGPT 和 Geminis 已經(jīng)攝取了整個互聯(lián)網(wǎng)數(shù)據(jù)世界并訓(xùn)練了模型,但高質(zhì)量的文本數(shù)據(jù)已經(jīng)被完全消耗掉了。AI 變得越來越智能的方式是通過稱為后訓(xùn)練和測試時計算或思維鏈推理的方法,這是模型相互檢查、生成合成數(shù)據(jù)并迭代響應(yīng)并產(chǎn)生更深思熟慮的結(jié)果的地方。盡管智能的每一次增長都非常有價值,但需要多兩到三個數(shù)量級的計算才能獲得智能的線性回報。因此,對計算的需求將繼續(xù)增長,而這樣做是為了降低成本,而這正是我們行業(yè)非常擅長的。我們改進(jìn)我們的制造流程。我們的產(chǎn)量越來越高,產(chǎn)量提高,成本下降。隨著這一趨勢的持續(xù),芯片制造的創(chuàng)新,尤其是封裝的創(chuàng)新將發(fā)揮核心作用。
ECTC 詳細(xì)介紹的主要進(jìn)展包括:
Intel 的混合鍵合低至 1μm 間距;
臺積電對 CoWoS 的直接冷卻,包括 4 個 SoC 和 6 個 HBM;
ITRI/Brewer Science 的 10 層 RDL,采用聚合物/銅混合鍵合;
佐治亞理工學(xué)院的小芯片作為冷卻劑,通過 TSV/硅柱進(jìn)行液體冷卻;
Corning/Fraunhofer IZM 用于光收發(fā)器的玻璃波導(dǎo);
三星用于移動處理器和 DRAM 的銅基加熱塊,以及
Imec 的熱通量與熱點(diǎn)的 3D 多芯片仿真。
熱切屑
的液體冷卻隨著強(qiáng)制空氣冷卻達(dá)到極限,切屑層的液體冷卻開始形成?!拔覀冋谠O(shè)法使用高速風(fēng)扇冷卻高達(dá) 1,000 瓦的設(shè)備,而風(fēng)扇功率消耗了大約 20% 的服務(wù)器機(jī)架預(yù)算,而我2R 損失占 10% 到 20%,“Naffziger 說。“所以現(xiàn)在我們有 40% 的電力僅用于輸送電流和提取熱量。這顯然不是構(gòu)建高效計算系統(tǒng)的方法。這就是推動直接液體冷卻無情發(fā)展的原因,這種冷卻在泵和冷凝器中有一些電力開銷,但比具有巨大散熱器的高速風(fēng)扇要小得多。
在會議上,臺積電的 Yu-Jen Lien 介紹了一種稱為硅集成微型冷卻器 (IMEC-Si) 的液體冷卻架構(gòu),該架構(gòu)正在使用有機(jī)中介層 (CoWoS-R) 上的 1.6X 標(biāo)線大小的測試車輛進(jìn)行可靠性測試。該散熱器旨在模擬 4-SoC、8-HBM 封裝,使用 40°C 水流速 10 升/分鐘,可以耗散超過 3,000 瓦的均勻功率。這種液體冷卻方法可提供卓越的冷卻效果(高達(dá) 2.5 W/mm)2功率密度)相對于具有熱界面材料方案的間接液體冷板。
圖 1:使用 10 L/min 水(下圖)的直接液體冷卻 CoWoS 比使用 TIM、蓋子和冷板配置的 CoWoS 散發(fā)更多的熱量。來源:IEEE ECTC [1]
TSMC 的組裝流程應(yīng)用了一個保護(hù)層來覆蓋 SoC 背面的銅柱陣列。將組件翻轉(zhuǎn)到載體晶片上,然后進(jìn)行 C4 碰撞。翻轉(zhuǎn)和保護(hù)層去除后,傳統(tǒng)的 CoWoS 流程之后,在 SoC 周邊分配彈性體密封劑。密封劑可最大限度地減少翹曲并密封芯片到蓋子的區(qū)域?!盎亓骱负?,將具有單個入口和出口的歧管組裝到集成系統(tǒng)上,該歧管旨在在多個冷卻室之間實(shí)現(xiàn)均勻的流量分布。”[1]
臺積電配備 4 個 SoC 和 6 個 HBM 芯片的 3.3X 掩線測試車經(jīng)歷了 160-190μm 的翹曲范圍,這會導(dǎo)致蓋子和 SoC 芯片之間的流速和輪廓發(fā)生變化。該封裝通過了氦氣泄漏測試和早期可靠性測試。
對直接切屑冷卻的需求非常迫切,以至于佐治亞理工學(xué)院提出了一個新穎的概念,即小芯片作為冷卻劑?!跋胂笠幌?,我們設(shè)計的小芯片成為現(xiàn)成開源社區(qū)的一部分,這些小芯片設(shè)計具有不同的冷卻能力,比如說具有不同的直徑、間距,但也具有不同的 TSV 設(shè)計,”佐治亞理工學(xué)院 3D 包集成中心主任 Muhannad Bakir 說?!拔覀兛梢栽谠摻Y(jié)構(gòu)中構(gòu)建獨(dú)特的 TSV 結(jié)構(gòu)、獨(dú)特的冷卻結(jié)構(gòu)以及獨(dú)特的其他功能,以幫助熱能和電力輸送。因此,它實(shí)際上只是成為堆棧中的混合粘合解決方案。Bakir 的小組展示了由硅制成的微型翅片引腳散熱器,具有 5nm TSV(見圖 2),可以冷卻 >300W/cm2。[2]
圖 2:微流體冷卻包括硅散熱器和用于芯片-芯片連接的硅通孔。來源:IEEE ECTC [2]
另一種冷卻方法在 Samsung 用于移動應(yīng)用的新型架構(gòu)中的應(yīng)用處理器頂部放置了一個加熱塊(見圖 3)。[3] Kyung Don Mun 及其同事探索了一種非對稱內(nèi)存和處理器結(jié)構(gòu),該結(jié)構(gòu)為處理器、內(nèi)存和基于銅的熱路徑模塊的放置提供了設(shè)計靈活性。
圖 3:從邏輯結(jié)構(gòu)上的對稱存儲器(左)切換到處理器上帶有銅熱路徑塊的非對稱結(jié)構(gòu)(右),改善了具有背面供電網(wǎng)絡(luò)的 2nm 柵極全環(huán)繞邏輯器件的散熱效果。來源:IEEE ECTC [3]
具有背面供電網(wǎng)絡(luò)的應(yīng)用處理器的 2nm 柵極全環(huán)繞晶體管結(jié)構(gòu)需要將模塊的散熱提高 20%。三星使用 Ansys 的有限元模型來識別高風(fēng)險區(qū)域并仿真翹曲?!癛DL 圖形設(shè)計優(yōu)化對于這種異構(gòu)封裝設(shè)計尤為重要,因為薄 RDL 容易受到熱機(jī)械應(yīng)力集中和裂紋失效的影響,”Mun 說。選擇具有更寬圖形寬度和更長圖形長度的再分布層減少了翹曲。成型材料、雙面 RDL 和熱界面材料得到了進(jìn)一步改進(jìn),以實(shí)現(xiàn)更高的導(dǎo)熱性和散熱性。
混合鍵合
細(xì)間距多層有機(jī)再分布層 (RDL) 作為硅中介層和層壓襯底的可行替代品越來越受歡迎。這種轉(zhuǎn)變是由 RDL 以低成本提供高速互連的能力推動的。工業(yè)技術(shù)研究所 (ITRI) 和 Brewer Science 展示了聚合物/銅 RDL 的五層堆疊,然后是銅-銅混合鍵合,針對高速數(shù)字應(yīng)用中的高 I/O、低回波損耗和低插入損耗。[4]
圖 4:聚合物/銅堆積的再分布層之后是具有受控翹曲的 Cu-Cu 混合鍵合。來源:IEEE ECTC [4]
在玻璃載體晶圓上構(gòu)建線/空間 RDL (4 至 10μm L/S)后,使用負(fù)色調(diào)光刻膠和 i-line 曝光對低 k 聚合物 (2.5) 進(jìn)行圖案化,然后進(jìn)行蝕刻、用鈦?zhàn)钃鯇雍豌~填充焊盤,然后用銅 CMP 平坦化?;旌湘I合使用 300°C (1.06 MPa) 的熱壓鍵合,然后通過 UV 激光進(jìn)行載體晶圓解鍵合。低模量、高熱穩(wěn)定性和低吸濕性等聚合物特性旨在實(shí)現(xiàn)多層 RDL 堆棧的低翹曲。
近年來,使用傳統(tǒng)電介質(zhì)(SiO2基/銅)的混合鍵合的間距縮放已經(jīng)從10μm(制造中)擴(kuò)展到1μm(研發(fā)中)。Intel 高級首席工程師 Adel Elsherbini 和他的同事討論了實(shí)現(xiàn)此類擴(kuò)展所需的一些功能。[5]
圖 5:Intel 使用混合鍵合的研究結(jié)果。來源:IEEE ECTC [5]
他們的論文指出,系統(tǒng)架構(gòu)通常決定是選擇晶圓到晶圓 (W2W) 還是晶片到晶圓 (D2W) 鍵合。晶圓到晶圓鍵合的主要限制是它需要相同大小的小芯片鍵合。該技術(shù)更成熟,可實(shí)現(xiàn)更精細(xì)的間距。晶片到晶片鍵合沒有尺寸限制,只使用已知良好的晶片?!皩τ?C2W 應(yīng)用,隨著 HB 間距繼續(xù)擴(kuò)展到 1μm 及以上,貼裝精度要求突破了當(dāng)前一代芯片鍵合機(jī)的極限。為了確保電氣連續(xù)性,整個小芯片區(qū)域需要達(dá)到相同的精度水平,低至幾十納米。類似于 W2W 鍵合的跳動和變形控制,芯片內(nèi)精度控制變得越來越重要,“作者說。
“傳統(tǒng)的貼裝精度標(biāo)準(zhǔn),如小芯片中心或最差角錯位,已經(jīng)不夠用了。D2W 工藝控制在鍵合過程中變得越來越復(fù)雜,以更多地關(guān)注每個小芯片級別的翹曲控制、芯片成型和鍵合波傳播控制。另一方面,為了量化晶粒內(nèi)部鍵合精度,需要新的對準(zhǔn)標(biāo)記策略和更好的鍵合后精度測量計量,以了解從芯片制備一直到鍵合的小芯片級變形行為。作者指出,紅外剝離可以重復(fù)使用硅載體晶圓,從而降低擁有成本。
使用背面電源
去除熱量背面供電是一種新穎的互連方案,它在晶圓背面構(gòu)建供電網(wǎng)絡(luò),以顯著降低與向晶體管供電相關(guān)的電壓下降。頂部的互連器僅可自由傳輸信號,從而提供許多電氣優(yōu)勢。
然而,相對于標(biāo)準(zhǔn)互連堆棧,這種新方法加劇了熱點(diǎn)問題(見圖 6)?!叭绻銖恼娴南鄬σ晥D來看,晶體管中產(chǎn)生的所有熱量都會直接進(jìn)入硅片,到達(dá)散熱器或冷板,”IBM 研究院高級技術(shù)人員 Dureseti Chidambarrao 說?!暗€有一個額外的不幸情況,你喜歡背面的電源——因為你把電源和信號分開了,所以這是一種不那么復(fù)雜的制造方式——但我們現(xiàn)在面臨著這個挑戰(zhàn),試圖從這種堆棧中去除熱量,因為熱尖峰和熱電路被困住了?!?/p>
圖 6:背面電源會感應(yīng)出新的熱流模式,因為有源器件夾在金屬堆棧之間。來源:Laura Peters/半導(dǎo)體工程
IBM 開發(fā)了一個各向異性模型,可以準(zhǔn)確計算通過后端堆棧的熱傳遞,同時考慮材料屬性。該 AI 模型將設(shè)計與互連堆棧中的本地功率密度、工作負(fù)載和材料屬性聯(lián)系起來?!澳隳?GDS 文件,它實(shí)際上會一起計算多個級別和多個層的平均屬性,這樣你就可以在每個給定位置獲得正確的 [傳熱] 平均屬性?,F(xiàn)在你有辦法計算每個瓷磚,而且你可以越來越細(xì)化它,“Chidambarrao 說。
在設(shè)計階段考慮此類熱因素的重要性怎么強(qiáng)調(diào)都不為過。“封裝和芯片正在相互作用,并且已經(jīng)變得非常緊密耦合,因此這是一個完整的系統(tǒng)技術(shù)優(yōu)化問題,你必須擔(dān)心設(shè)計中的熱問題,”他說。“這尤其必須發(fā)生在背面電源上,我什至沒有想象到最糟糕的事情——在 3D 芯片上放置背面電源。如果這是你想做的,那么解決方案顯然要嚴(yán)格得多。
背面供電已經(jīng)被設(shè)計到芯片中?!拔覀冾A(yù)計明年將首次在產(chǎn)品中實(shí)現(xiàn)背面電源,”imec 的主要技術(shù)人員兼熱建模和特性研發(fā)團(tuán)隊負(fù)責(zé)人 Herman Oprins 說?!半m然背面電源最初是無源結(jié)構(gòu),但進(jìn)一步這也將用于包括信號時鐘和其他功能。方法有很多種,但最重要的是你需要通過 nanoTSV 連接正面和背面。
NanoTSV 要求將硅減薄到至少 300nm,可能小于 100nm。此外,還需要進(jìn)行詳細(xì)的建模來了解此類設(shè)備的冷卻需求。
Oprins 說:“如果你有一個局部熱點(diǎn)和超薄硅,你的溫度實(shí)際上會升高,因為你有更少的電量(硅)來分散它。另一方面,背面有金屬堆棧,因此這種密集的金屬陣列可能有助于設(shè)備的熱量擴(kuò)散。
Imec 之前表明,實(shí)施背面電源會造成 10% 到 30% 的熱損失 (ECTC 2024)。今年,Oprins 的小組使用 BSPDN 模擬了堆疊邏輯對內(nèi)存或內(nèi)存對邏輯的熱效應(yīng)。這些仿真包括芯片的面對面混合鍵合和背對面鍵合,結(jié)合使用玻爾茲曼傳輸方程和蒙特卡洛仿真。仿真說明了均勻芯片加熱與熱點(diǎn)影響之間的溫升差異(見圖 7)。
圖 7:具有均勻器件加熱(左)的器件溫度升高與有額外熱點(diǎn)的器件。來源:IEEE ECTC [7]
“堆棧中邏輯和內(nèi)存芯片的順序?qū)嵝阅艿挠绊懜?,”O(jiān)prins 說?!坝捎诳拷鋮s,Logic-on-top 導(dǎo)致邏輯溫度較低,但由于堆棧中的高熱耦合,內(nèi)存溫度較高?!倍鄬?memory-on-logic 表明,BSPDN 的熱影響減少了多個芯片堆疊。在這種情況下, logic on top configuration 受 memory die temperature 的熱限制,而對于 memory-on-top configuration,logic temperature 是限制因素。該論文總結(jié)道:“更高效的冷卻表明,3D SoC BSPDN 的熱性能得到了顯著改善,從而實(shí)現(xiàn)了具有校準(zhǔn)功耗的內(nèi)存邏輯配置。[7]
Oprins 強(qiáng)調(diào)了液體冷卻的重要性。Oprins 說:“看看 3D 架構(gòu),如果你每個芯片堆疊 5 個芯片,比如說耗散 100 瓦并使用傳統(tǒng)的空氣冷卻,那么你最終得到的最大結(jié)溫遠(yuǎn)大于 500°C。如果集成冷板,則最高結(jié)溫約為 250°C。 然而,如果你能以某種方式在電堆內(nèi)開發(fā)層間冷卻,那么突然之間就有機(jī)會真正將溫度降低到 50°C 左右,“imec 的 3D 電堆模擬說。
共封裝光學(xué)器件
行業(yè)對更快數(shù)據(jù)網(wǎng)絡(luò)和設(shè)備接口速度的需求正在急劇增加。數(shù)據(jù)中心機(jī)架內(nèi)部的一個關(guān)鍵推動因素是將光學(xué)引擎與 GPU 和 HBM 集成到同一個封裝中?!敖柚卜庋b光學(xué)器件 (CPO),我們有機(jī)會將電氣互連與光學(xué)連接集成到一個封裝中,”ASE 研究員 CP Hung 說?!斑@是該行業(yè)的新里程碑。通過將光學(xué)引擎移到更靠近處理器的位置,我們將每根光纖的 200 Gb/s 提高到 6.4Tb/s,帶寬增加了 32 倍。
盡管 CPO 做出了承諾,但未知數(shù)仍然存在?!癈PO 肯定會發(fā)生,而且這種勢頭肯定會推動它盡早發(fā)生,”ASE 工程、營銷和技術(shù)推廣高級總監(jiān) Mark Gerber 說?!笆褂?CPO 時,熱側(cè)和翹曲側(cè)都存在敏感性。重要的是,該行業(yè)希望保持當(dāng)今存在的光學(xué)引擎的可插拔(即可替換)方面。但是,雖然 plug-able 很容易切換,但它們并不容易掌握。
在 ECTC 上,ASE 展示了其用于 ASIC 交換機(jī)和以太網(wǎng)/HBM 共封裝光學(xué)平臺的模塊化平臺。
熱仿真在選擇先進(jìn)封裝散熱堆棧的架構(gòu)、工藝和材料方面也發(fā)揮著關(guān)鍵作用?!皬臍v史上看,在單片芯片集成中,封裝設(shè)計和散熱器的熱仿真是按照通過/不通過的方式進(jìn)行的,”Amkor Technology 的熱仿真工程師 Tom Nordstog 說。借助多小芯片封裝,仿真在封裝設(shè)計的早期階段發(fā)揮著更明顯的作用。“熱仿真是一項風(fēng)險/回報練習(xí),旨在選擇最終設(shè)計。理想情況下,封裝的熱設(shè)計發(fā)生在芯片設(shè)計之前。我們看到最積極的客戶在這些早期階段就采用熱仿真。
康寧和Fraunhofer IZM提出了一種可擴(kuò)展的“平面2D波導(dǎo)電路',可以通過減少對光纖電纜終端和手動組裝的需求,為未來幾代CPO解決方案減少所需的空間、復(fù)雜性和成本。[8]該團(tuán)隊使用 460 x 303 毫米熔融成型玻璃面板制造了具有波導(dǎo)布局的單模板級互連,旨在滿足將 1024 個光鏈路從面板連接到 CPO 模塊的光互連要求,用于 102.4 Tb/s 數(shù)據(jù)中心交換機(jī)應(yīng)用。Fraunhofer IZM 工程師設(shè)計了工藝流程(見圖 8),其中包括將單模波導(dǎo)集成到玻璃中的熱離子交換工藝,與 1310nm 波長的單模光纖的光模式相匹配。移除掩模后,執(zhí)行第二個反向離子交換過程步驟,將波導(dǎo)的核心埋在玻璃表面以下,以減少傳播損耗。
Brusberg 說:“為了與玻璃波導(dǎo)面板的光纖連接,組裝了 MPO-16 適配器,并將玻璃波導(dǎo)電路集成到 1U 機(jī)架機(jī)箱中,以展示僅 0.7 mm 的扁平外形。這種新穎的方法可以為基于 PCB 的光收發(fā)器鋪平道路。
圖 8:工藝流程包括金屬沉積、光刻膠涂層、波導(dǎo)成像和離子交換,以將銀擴(kuò)散到圖案中。來源:IEEE ECTC [8]
引用
Y-J Lien,“集成在 CoWoS 平臺上的直接到硅液體冷卻”,IEEE 電子元件和技術(shù)會議,2025 年 5 月,正在出版。
Yan 等人,“面向 3D IC 的 TSV 兼容微流體冷卻”,IEEE Transactions on Components, Packaging and Manufacturing Technology,第 15 卷,第 1 期,第 104-1,12 頁,2025 年 1 月,doi:10.1109/TCPMT.2024.3516653。
D. Mun 等人,“一種增強(qiáng)散熱的移動應(yīng)用中設(shè)備端 AI 的新型架構(gòu)”,IEEE 電子元件和技術(shù)會議,2025 年 5 月,正在出版。
-H. Lee 等人,“通過可轉(zhuǎn)移銅/聚合物混合鍵合實(shí)現(xiàn)具有新穎結(jié)構(gòu)的分層多層和堆疊通孔,用于高速數(shù)字應(yīng)用”,IEEE 電子元件和技術(shù)會議,2025 年 5 月,正在印刷中
Chang 等人,“先進(jìn) BEOL 堆棧等效熱特性的熱建模和分析”,IEEE Transactions on Components, Packaging and Manufacturing Technology,doi:10.1109/TCPMT.2025.3564833。
Elsherbini等人,“通過低于1um間距的混合鍵合和先進(jìn)的硅載體技術(shù)實(shí)現(xiàn)的Mid-BEOL異構(gòu)集成,用于AI和計算應(yīng)用”,IEEE電子元件和技術(shù)會議,2025年5月,正在出版。
R. Chowdhury,“Backside Power Delivery and Chiplet Architectures中后端線熱阻的快速準(zhǔn)確機(jī)器學(xué)習(xí)預(yù)測”,IEEE 電子元件和技術(shù)會議,2025 年 5 月,正在出版。
Brusberg,“用于面板和共封裝光收發(fā)器之間板級光互連的大規(guī)模玻璃波導(dǎo)電路”,IEEE 電子元件和技術(shù)會議,2025 年 5 月,正在出版。
評論