生成式AI吸引了目光、掀起了大浪,而如果要得到持續(xù)發(fā)展,需要的是:一半火焰、一半海水。
火焰,是火熱的。各類大模型開發(fā)、各類工具應(yīng)用問世、各類算力資源提升、各種生態(tài)形態(tài)豐富。
海水,是冷靜的。高效平衡、利用各種資源,尤其在功耗、散熱方面,算力需求越大,“制冷”的需求就越高。這是一個不那么顯眼,但又無比重要的領(lǐng)域。畢竟,過熱的GPU、CPU,不僅會罷工,也會帶來直接或間接的損失。因此,也成為算力使用者要關(guān)切的重要事物。
而在散熱領(lǐng)域,一個加速的趨勢就是,液冷,正取代風冷,成為制冷領(lǐng)域的主力,從奢侈進入普惠時代。
迭代升級的必然
電子產(chǎn)品甚至任何商品,升級迭代都是一個必然規(guī)律。就像最近很火的光模塊,從40G取代10G,100G取代40G,400G取代100G,800G取代400G,升級之路永不停歇。而每一代產(chǎn)品,也都經(jīng)歷了從“奢侈”、“嘗鮮”到“普及”、“剛需”的過程。
在散熱領(lǐng)域也是如此。比如從人的需求來看,先是扇子、后來電扇、再后來空調(diào),空調(diào)也有了變頻,技術(shù)升級的同時,制冷越來越有效。而電腦、服務(wù)器等電子產(chǎn)品,隨著功耗越來越高,散熱需求、相應(yīng)技術(shù)也在提升。先是自然風冷、空調(diào)風扇、散熱片,繼而是液冷。液冷也有噴淋式、冷板式和浸沒式等等。
產(chǎn)品迭代升級的驅(qū)動力,就是第一性原理。滿足業(yè)務(wù)的核心需求,并提供越來越高的綜合性價比。無論投資還是實業(yè),都需要把握產(chǎn)品迭代升級的節(jié)奏。過早,會導致成本過高、甚至可能失敗;過慢,就會喪失先機和機遇。
于是,關(guān)鍵點在于判斷:拐點何時來。
液冷的拐點來臨
液冷時代的必要性、可行性都在大幅提升。
首先,必要性方面,當前數(shù)據(jù)中心的高功耗,正成為不得不面對的問題。而傳統(tǒng)的風冷散熱,已經(jīng)無法應(yīng)對。
工信部曾有一份數(shù)據(jù)預測,到2025年,中國數(shù)據(jù)中心耗電量占全國用電量比重預計將從2018年的1.6%增長到5.8%。在“雙碳”的要求下,數(shù)據(jù)中心節(jié)能減排成為大事。
比如政策也規(guī)定,新建大型、超大型PUE小于1.3,國家樞紐節(jié)點小于1.25,可再生能源利用率明顯提升,綠色低碳等級4A以上。而風冷方式下數(shù)據(jù)中心的PUE值通常在1.5左右,離政策要求有不少差距。
與此同時,AI發(fā)展帶來的高功耗,也已經(jīng)突破了風冷的能力上限。比如單芯片來看,風冷芯片級散熱功耗上限是800W,GPU已達到了700W,接近風冷上限。而高算力GPU的研發(fā)還在繼續(xù)。
從數(shù)據(jù)中心角度來看,自然風冷的數(shù)據(jù)中心,單機柜密度一般只支持 8-10kW,在機柜功率超過 10kW 后性價比大幅下降。而2025年AI集群算力單機柜密度將會達到20-50kW,也遠遠超出了風冷的上限。
數(shù)據(jù)來源:綠色高能效數(shù)據(jù)中心散熱冷卻技術(shù)研究現(xiàn)狀及發(fā)展趨勢
因此,無論是新建數(shù)據(jù)中心,還是數(shù)據(jù)中心改造,采用液冷已經(jīng)不再是“可選項”,而是“必選項”。尤其PUE 1.3 成為數(shù)據(jù)中心建設(shè)“綠線”,節(jié)能改造刻不容緩。
其次,液冷的性價比,提供了良好的可行性。液冷的好,大家都知道,而之前一個困難就是“貴”,但當下,隨著技術(shù)發(fā)展、產(chǎn)業(yè)鏈不斷成熟,以及產(chǎn)品規(guī)模擴大帶來了降本,液冷和風冷相比,體現(xiàn)出了更優(yōu)的性價比。
在功率密度為 10kW/機架狀況下,風冷和液冷數(shù)據(jù)中心的投資成本大致相等。當提升2倍功率密度(每機架 20kW)后,初投資可降低10%。當提升4倍功率密度(每機架 40kW),可節(jié)省高達14%的投資成本。
有政策帶來的引導和迫切,有技術(shù)提升帶來的效果,還有更劃算的成本,那么,對液冷的選擇,便是理所當然。
如何讓奢侈到普惠發(fā)生
當然,美好的事物,并不會自動發(fā)生,也需要更好的落地路徑。
就以數(shù)據(jù)中心改造來說,也是難題重重。首先是技術(shù)難度,液冷不是傳統(tǒng)的風冷,多上幾個風扇,把轉(zhuǎn)速提高。風轉(zhuǎn)液冷首先要考驗包括復雜部件液冷適配、漏液可靠性等在內(nèi)的綜合技術(shù)。
其次,液冷的初期建設(shè)成本會高10%左右,用戶傾向于關(guān)注初期建設(shè)成本,往往忽略了液冷釋放的性能而帶來的業(yè)務(wù)效益與節(jié)能效果。第三,落地麻煩,涉及到樓體改造、空間布局、施工難度大、改造周期長。
那么,如何讓想法落地?
這也是寧暢從公司成立之初就在考慮的事情。三年前,公司就開始布局液冷,率先的思考和布局,確保了公司的執(zhí)行力、對需求和行業(yè)發(fā)展趨勢的理解力。
當下,寧暢帶來的方案就是:數(shù)據(jù)中心的“無憂煥液計劃”,包括:嘗鮮煥液、升級煥液、尊享煥液三大套餐,“多、快、好、省”地推薦數(shù)據(jù)中心轉(zhuǎn)型升級。
三個套餐各有特色。嘗鮮版,顧名思義,是用戶想體驗、嘗試一下,這種業(yè)務(wù)體量小,可以快速登門改造,有點像快遞行業(yè)次日達;升級版,用戶的業(yè)務(wù)規(guī)模相對加大,對液冷的需求也比較明確,寧暢可以為用戶提供全棧液冷模塊化的解決方案,這種方式更類似于“預制菜”模式,工廠預制好后到機房進行安裝;尊享版,對于那些預算充裕,想引領(lǐng)技術(shù)潮流的用戶,可以提供更先進的浸沒式液冷全系統(tǒng)解決方案。
這種由小到大、從輕到重、從體驗到喜歡,循序漸進的產(chǎn)品方案,可以確保用戶對新技術(shù)、新產(chǎn)品的接受度更絲滑,也享受到實實在在的收益。
比如“次日達”方案,僅部件溫度降低,就可以帶來性能提升10%左右,甚至更多。升級版,實現(xiàn)了模塊化按需組合與解耦,冷板覆蓋甚至可達到95%。尊享版,可使PUE≤1.05, 趨近于1,且性能提升20%,性能提升也就意味著業(yè)務(wù)能力的提升。
寧暢在液冷方面的能力建設(shè),為這些方案提供了保障?!岸唷眻鼍埃豪浼夹g(shù)可覆蓋包括通用、AI、機架、整機柜等產(chǎn)品;“快”交付,用標準化、模塊化,實現(xiàn)工廠預制直接到現(xiàn)場安裝;“好”迭代,可實現(xiàn)從風冷-風液混合-全液冷的各階段遞進式方案服務(wù),以及浸沒液冷全系統(tǒng)打造;“省”心力,公司可以從一次側(cè)到二次側(cè),全面提升運維效率,協(xié)同管理。
產(chǎn)品和服務(wù)體系的完善,也不是一日之功,而是“軟磨硬泡”后的真功夫。
軟方面,布局早是寧暢的重要優(yōu)勢,目前,寧暢已經(jīng)有18萬臺液冷的出貨量,液冷經(jīng)驗豐富,此外寧暢具備完善的液冷設(shè)計庫,囊括各類問題及素材。這也使得寧暢可靈活地實現(xiàn)液冷產(chǎn)品的設(shè)計、驗證和量產(chǎn),可以保證機房的建設(shè),以及針對性地對機房進行改造。
硬方面,為了確保交付,寧暢有布局在北京、天津、杭州、深圳的四個研發(fā)中心。本地化的團隊,可以確保第一時間向用戶登門拜訪、交流方案、部署維護。同時,公司也布局了三大生產(chǎn)基地,分別在華北、華東和華南,可以實現(xiàn)就近生產(chǎn)、制造、交付。
先發(fā)是種優(yōu)勢,而對產(chǎn)業(yè)的堅定、對用戶需求的關(guān)切,才可以將產(chǎn)品優(yōu)勢轉(zhuǎn)變?yōu)橛脩舻膶嵲诶妗?/p>
尾聲
算力浪潮,熱度要有,吸引人才和資金;冷靜,更要有,讓算力保持在最佳效果。不早不晚,當下,正是液冷從奢侈到普惠的開始。布局當下,享受算力騰飛的紅利,參與AI提效各行各業(yè)的浪潮。