浸沒液冷—高功率場景散熱需求終結(jié)者
2024-12-09 09:07:00
中華網(wǎng)
在當(dāng)代科技界,特別是在人工智能和新能源等技術(shù)領(lǐng)域,技術(shù)進步正以空前的速度迅猛發(fā)展。這些領(lǐng)域技術(shù)發(fā)展的顯著特征是設(shè)備功率的不斷提升和體積的逐漸縮小,從而使得散熱挑戰(zhàn)日益嚴峻。隨之而來的是散熱技術(shù)的不斷創(chuàng)新,從傳統(tǒng)的風(fēng)冷到冷板液冷,再到近年來復(fù)興的浸沒式液冷技術(shù)。
展望未來,浸沒式液冷技術(shù)有望成為散熱領(lǐng)域的主流。以下因素預(yù)示著這一趨勢:
人工智能技術(shù)的核心在于大規(guī)模數(shù)據(jù)處理和復(fù)雜算法運算,導(dǎo)致IT設(shè)備運算量激增,功率顯著提高。例如,NVIDIA最新發(fā)布的B200單顆GPU芯片功率已達到1000W。這種高功率密度帶來了散熱難題,因為過高的溫度會嚴重影響IT設(shè)備的性能和穩(wěn)定性,甚至可能導(dǎo)致硬件損壞。因此,迫切需要更高效的散熱解決方案。新能源汽車和汽車充電設(shè)備等領(lǐng)域也面臨著類似的挑戰(zhàn)。
在國家的科技發(fā)展戰(zhàn)略規(guī)劃中,對人工智能的發(fā)展給予了高度重視和積極推動。近年來,政府相繼頒布了一系列政策,旨在促進數(shù)據(jù)中心和智算中心的建設(shè),以增強我國在人工智能領(lǐng)域的競爭力和創(chuàng)新能力。
伴隨數(shù)據(jù)中心規(guī)模的持續(xù)擴張及能耗的顯著上升,國家對數(shù)據(jù)中心和智算中心機房的建設(shè)標準提出了更為嚴格的要求。特別是,電能利用效率(PUE值——即數(shù)據(jù)中心總體能耗與IT設(shè)備能耗之比,該值越接近1表明能源利用效率越高)已成為評估數(shù)據(jù)中心能效的關(guān)鍵性能指標。根據(jù)當(dāng)前的國家政策,新建數(shù)據(jù)中心的PUE值普遍需控制在1.3以下,某些地區(qū)更是提出了將PUE值降至1.2甚至1.1的更高要求。這一政策導(dǎo)向激勵了數(shù)據(jù)中心行業(yè)積極探索更為節(jié)能高效的散熱解決方案,從而為浸沒液冷技術(shù)的廣泛采納和應(yīng)用創(chuàng)造了政策機遇。
風(fēng)冷作為傳統(tǒng)的散熱方式,在面對日益增長的IT設(shè)備散熱需求時其局限性越來越明顯。當(dāng)單CPU功率超過300W時,風(fēng)冷系統(tǒng)無法有效地將熱量散發(fā)出去,導(dǎo)致CPU溫度過高,進而出現(xiàn)降頻現(xiàn)象,嚴重影響設(shè)備的性能。在整機柜功率達到15kW以上時,風(fēng)冷系統(tǒng)同樣也會力不從心了。
在高端功率應(yīng)用場景中,風(fēng)冷技術(shù)的逐步淘汰為液冷技術(shù)的高速發(fā)展提供了空間。得益于其相對較低的前期成本和較為成熟的產(chǎn)業(yè)鏈支持,冷板液冷技術(shù)在液冷技術(shù)路線的競爭中取得了先機,進入快速發(fā)展階段。然而,其快速發(fā)展亦暴露出若干問題:
一是節(jié)能效率提升需求。盡管冷板液冷技術(shù)在某些方面優(yōu)于風(fēng)冷技術(shù),但其節(jié)能效率仍有提升空間。該技術(shù)的最低PUE值僅能降至1.2,與國家政策標準和行業(yè)發(fā)展趨勢相比,存在顯著差距。以中等規(guī)模的數(shù)據(jù)中心為例,采用PUE值為1.2的冷板液冷系統(tǒng),相較于采用PUE值為1.1的高效散熱技術(shù)(如浸沒液冷)的數(shù)據(jù)中心,每年在電力成本上的額外支出可能高達數(shù)十萬元人民幣。
二是成本考量。冷板液冷系統(tǒng)的總體成本相對較高,一方面,冷板的設(shè)計、制造和安裝需要專業(yè)的技術(shù)支持和設(shè)備,導(dǎo)致初期投資成本增加。據(jù)行業(yè)分析數(shù)據(jù),冷板液冷系統(tǒng)的初始投資成本較傳統(tǒng)風(fēng)冷系統(tǒng)高出30%-50%。另一方面,該系統(tǒng)的維護復(fù)雜,需要定期檢查冷卻液的泄漏情況和冷板的散熱性能,成本將會進一步增加。
三是安全性評估。第一、業(yè)務(wù)連續(xù)性安全,冷板液冷系統(tǒng)若發(fā)生冷卻液泄漏或冷板故障,可能導(dǎo)致服務(wù)器局部過熱或短路,今年已有多起因冷卻液泄漏導(dǎo)致的數(shù)據(jù)中心故障事件發(fā)生。第二、供應(yīng)鏈安全,冷板液冷技術(shù)屬于定制化液冷解決方案,對服務(wù)器的匹配度要求嚴格。一旦系統(tǒng)安裝完畢,服務(wù)器與冷板液冷系統(tǒng)之間形成緊密的依賴關(guān)系。若需更換供應(yīng)商,不僅需重新進行兼容性測試,還可能面臨技術(shù)改造的挑戰(zhàn),這對數(shù)據(jù)中心的供應(yīng)鏈穩(wěn)定性構(gòu)成潛在威脅。第三、 消防安全,隨著數(shù)據(jù)中心、鋰電池、充電設(shè)備等功率密度的提升,安全風(fēng)險相應(yīng)增加。在消防安全風(fēng)險方面,冷板液冷系統(tǒng)仍未能提供有效的安全保障。
經(jīng)過長期的積累和實踐,近兩年浸沒式液冷技術(shù)取得了突破性進展,不管是技術(shù)還是成本上,都達到了大規(guī)模實用的條件。其中,杭州京工電科技有限公司是典型的代表,其自研的浸沒液冷具有非常優(yōu)良的物理和化學(xué)屬性,可以兼容各類IT設(shè)備、鋰電池以及新能源充電設(shè)備等。更重要的是,他們的冷卻液在價格方面也已掃清了大規(guī)模商業(yè)推廣的障礙。
浸沒液冷方案是將服務(wù)器、鋰電池等硬件完全浸沒在特制的冷卻液中,冷卻液通過循環(huán)的方式將熱量帶走,然后通過熱交換模塊將熱量傳遞給外部環(huán)境。這種散熱方式具有諸多優(yōu)勢:
一是高效散熱:浸沒液冷技術(shù)通過與發(fā)熱元件的直接接觸,極大提升了熱傳遞效率。在數(shù)據(jù)中心應(yīng)用中,能夠從容應(yīng)對單CPU功率1000W以上、整機柜功率30kW以上的散熱需求。在新能源汽車充電樁領(lǐng)域,更能適應(yīng)兆瓦級的超快速充電需求。
二是顯著節(jié)能:得益于其高效的散熱能力,浸沒液冷技術(shù)顯著降低了數(shù)據(jù)中心的PUE值。京工電科技已實現(xiàn)將數(shù)據(jù)中心的PUE值降至1.1以下,極大提升了運營效率。在充電樁應(yīng)用中,通過將充電模塊浸入冷卻液,實現(xiàn)了97.6%的整機功率轉(zhuǎn)換效率,據(jù)公開數(shù)據(jù)顯示,這一轉(zhuǎn)換效率是行業(yè)內(nèi)最高的。
三是成本控制潛力:PUE值從1.3降至1.1以下,意味著機房IT設(shè)備之外的功耗從總功率的30%降至10%以內(nèi),相應(yīng)地,散熱系統(tǒng)和供電系統(tǒng)的需求減少了三分之二,整體成本顯著降低。
四是安全性保障:設(shè)備安全方面,浸沒液冷的冷卻液通常具備良好的阻燃性和化學(xué)穩(wěn)定性,顯著降低了火災(zāi)風(fēng)險。此外,系統(tǒng)的封閉性可有效減少外部因素導(dǎo)致的故障風(fēng)險,確保業(yè)務(wù)的連續(xù)安全運行。在供應(yīng)鏈安全方面,浸沒液冷系統(tǒng)的通用性強,供應(yīng)商切換相對便捷,不會對數(shù)據(jù)中心供應(yīng)鏈帶來任何風(fēng)險。
綜上所述,在人工智能、新能源的發(fā)展導(dǎo)致各類設(shè)備散熱需求劇增的背景下,業(yè)務(wù)、政策、需求以及浸沒液冷本身技術(shù)的發(fā)展,已經(jīng)使得浸沒液冷技術(shù)開始在熱管理領(lǐng)域重新嶄露頭角,并逐漸接管熱管理的未來,成為數(shù)據(jù)中心、智算中心、新能源等眾多領(lǐng)域熱管理方向的高競爭力技術(shù)方案,將對整個IT、新能源、電池等領(lǐng)域的可持續(xù)發(fā)展產(chǎn)生深遠影響。