• 正文
    • AI計算的能效與可持續(xù)性
    • 安全技術(shù)的挑戰(zhàn)與應(yīng)對
    • 芯片設(shè)計的變革
    • 軟件生態(tài)的挑戰(zhàn)
    • 結(jié)語
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

AI時代 芯片的成功法則

04/27 09:30
271
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

過去40年,芯片技術(shù)歷經(jīng)巨變。20世紀(jì)80至90年代,超大規(guī)模集成電路VLSI)和極大規(guī)模集成電路(ULSI)技術(shù)為芯片設(shè)計奠定了基礎(chǔ),推動晶體管數(shù)量每兩年翻倍,實現(xiàn)了算力與能效的指數(shù)級增長。這一趨勢促進(jìn)了芯片組的小型化,尤其是移動芯片的興起,使得半導(dǎo)體產(chǎn)業(yè)將目光聚焦于移動芯片組。隨后在2000年代中期,智能手機(jī)的誕生,進(jìn)一步推動了如今市場上更強(qiáng)大、更復(fù)雜的移動芯片——系統(tǒng)級芯片(SoC)的發(fā)展。

然而,隨著對計算功能與組件需求的增加以及摩爾定律逼近極限,現(xiàn)代SoC設(shè)計重新聚焦性能提升與高能效計算的協(xié)同實現(xiàn)。AI時代,AI計算工作負(fù)載的規(guī)模與復(fù)雜性都持續(xù)攀升,帶來了能源消耗激增與成本不斷攀升的壓力。為此,行業(yè)正推動AI領(lǐng)域的高能效計算,覆蓋從大型數(shù)據(jù)中心到邊緣設(shè)備的所有技術(shù)觸點(diǎn)。在必要和相關(guān)的應(yīng)用場景中,邊緣端處理AI工作負(fù)載可優(yōu)化網(wǎng)絡(luò)帶寬、強(qiáng)化數(shù)據(jù)隱私、提升用戶體驗,但也要求在空間和功耗受限的小型設(shè)備上實現(xiàn)更高效AI處理能力。

最近,Arm推出了一份報告——《芯片新思維:人工智能時代的新根基》,該報告聚焦四大關(guān)鍵趨勢:一是打造專用架構(gòu)以應(yīng)對特定工作負(fù)載,尤其是AI領(lǐng)域;二是計算密集度提升,能效至關(guān)重要;三是安全技術(shù)演進(jìn),應(yīng)對AI驅(qū)動型威脅;四是軟件生態(tài)系統(tǒng)在釋放芯片潛能中扮演關(guān)鍵角色。

Arm 解決方案工程部執(zhí)行副總裁Kevork Kechichian表示,隨著摩爾定律驅(qū)動的傳統(tǒng)半導(dǎo)體縮放技術(shù)逼近物理與經(jīng)濟(jì)極限,產(chǎn)業(yè)正加速向定制芯片、計算子系統(tǒng)(CSS)及芯粒(chiplet)等創(chuàng)新方案轉(zhuǎn)型,以突破性能與能效瓶頸。

AI計算的能效與可持續(xù)性

挑戰(zhàn)首先來自于能效與可持續(xù)性。AI工作負(fù)載從訓(xùn)練龐大模型到執(zhí)行復(fù)雜推理任務(wù),對能效、可擴(kuò)展性和成本效益帶來重大挑戰(zhàn)。

AI計算需求極大,需大量電力支持,且未來將持續(xù)增長。從芯片設(shè)計的角度來看,能耗主要源于計算和數(shù)據(jù)傳輸,還需處理熱量冷卻。高盛預(yù)計,AI將推動數(shù)據(jù)中心電力需求增長達(dá)160%。為降低能源成本,芯片設(shè)計正集成優(yōu)化內(nèi)存層次結(jié)構(gòu)與協(xié)同通信機(jī)制,減少數(shù)據(jù)傳輸,并利用芯片堆疊、高帶寬內(nèi)存及先進(jìn)互連技術(shù)降低能耗。同時,AI框架和算法也針對每瓦性能和單位成本性能進(jìn)行微調(diào),實現(xiàn)算力與經(jīng)濟(jì)可持續(xù)性平衡。

另一方面,針對特定市場需求打造的定制芯片正在成為行業(yè)趨勢。不僅谷歌、微軟,AWS等有自己的定制加速器,中小企業(yè)也在積極研發(fā)定制芯片。Arm Neoverse CSS經(jīng)過驗證的核心計算功能以及靈活的內(nèi)存與I/O接口配置,加快了產(chǎn)品的上市進(jìn)程,在確保軟件一致性的同時,保留了系統(tǒng)級優(yōu)化的靈活性。

先進(jìn)的封裝技術(shù)和工藝是近期芯片演進(jìn)的另一個重要方向,同時也推動了芯粒的發(fā)展。這些技術(shù)允許多個半導(dǎo)體晶粒的堆疊和互連,在提升性能和能效的同時,開創(chuàng)了現(xiàn)代芯片設(shè)計的可能性,如晶粒間接口以及新的 2.5D 和 3D 封裝解決方案。芯粒市場的蓬勃發(fā)展為定制芯片的崛起鋪平道路,從而降低成本,并可利用現(xiàn)有的組件作為芯片的構(gòu)建模塊,加速開發(fā)速度并助力企業(yè)實現(xiàn)差異化優(yōu)勢。

安全技術(shù)的挑戰(zhàn)與應(yīng)對

AI技術(shù)領(lǐng)域,AI驅(qū)動的網(wǎng)絡(luò)威脅日益嚴(yán)峻,能夠自我進(jìn)化、識別系統(tǒng)漏洞并發(fā)動復(fù)雜攻擊。DarkTrace 2024年的一份報告指出,近74%的受訪者表示AI驅(qū)動的網(wǎng)絡(luò)威脅對其組織有顯著沖擊,60%的受訪者擔(dān)心組織未做好充分準(zhǔn)備。

Kevork Kechichian表示,“盡管由AI驅(qū)動的網(wǎng)絡(luò)攻擊正成為新興的威脅前沿,行業(yè)正在構(gòu)建多層級的軟硬件防護(hù)體系,從嵌入在芯片中的加密技術(shù),到經(jīng)AI強(qiáng)化的安全監(jiān)測系統(tǒng),現(xiàn)代SoC架構(gòu)正不斷加固防線,以抵御傳統(tǒng)攻擊與新一代威脅。”目前,現(xiàn)代SoC 已經(jīng)集成了復(fù)雜的安全機(jī)制,如硬件信任根(RoT)、可信執(zhí)行環(huán)境(TEE)、安全內(nèi)存管理單元(MMU)、安全飛地等。

此外,定制芯片的興起對安全性提出了更高要求。目前,PSA Certified認(rèn)證項目已成為安全芯片設(shè)計領(lǐng)域的黃金標(biāo)準(zhǔn),而作為該認(rèn)證項目補(bǔ)充的物聯(lián)網(wǎng)平臺安全評估標(biāo)準(zhǔn)(SESIP)則為定制芯片提供了安全評估的結(jié)構(gòu)化方法。此外,監(jiān)管環(huán)境如針對車輛網(wǎng)絡(luò)安全的UNECE R155和針對汽車系統(tǒng)的ISO/SAE 21434標(biāo)準(zhǔn),也為定制芯片設(shè)定了嚴(yán)格的行業(yè)特定要求。

芯片設(shè)計的變革

在AI技術(shù)的推動下,芯片設(shè)計領(lǐng)域正經(jīng)歷著前所未有的劇變。這一變革源自AI工作負(fù)載激增和半導(dǎo)體縮放技術(shù)放緩的雙重作用。傳統(tǒng)芯片技術(shù)在28納米節(jié)點(diǎn)開始遇到瓶頸,在向7納米及更先進(jìn)工藝推進(jìn)的過程中,挑戰(zhàn)加劇。進(jìn)入2納米及以下的全環(huán)繞柵極時代,傳統(tǒng)縮放技術(shù)的優(yōu)勢變得愈發(fā)難以維持,且成本高昂。

尤為明顯的是SRAM縮放進(jìn)程的放緩:從5納米到2納米工藝節(jié)點(diǎn),SRAM單元面積并未出現(xiàn)顯著縮減,盡管其在功耗和性能方面仍有所改進(jìn)。此外,如今所謂的“縮放”主要是通過一些被稱為“縮放助推器”的結(jié)構(gòu)性創(chuàng)新來實現(xiàn),諸如連續(xù)有源區(qū)/氧化擴(kuò)散區(qū)、有源柵極上接觸、全環(huán)繞柵極晶體管及背面供電技術(shù)等,也成為提升晶體管密度的途徑。

隨著片上內(nèi)存縮放速度放緩,先進(jìn)AI工作負(fù)載等新型計算范式應(yīng)運(yùn)而生,其對內(nèi)存帶寬的需求大幅增長。這一趨勢推動了內(nèi)存架構(gòu)的創(chuàng)新,包括高帶寬存儲器(HBM)集成新方案的出現(xiàn)。由此催生的近存計算架構(gòu)能夠幫助減少數(shù)據(jù)在內(nèi)存與處理器之間傳輸所需的時間和功耗。內(nèi)存也因此成為計算架構(gòu)中不可或缺的組成部分。

AI 的發(fā)展促使芯片設(shè)計設(shè)計的不斷變革。AI工作負(fù)載需要針對大規(guī)模并行處理和內(nèi)存帶寬優(yōu)化的差異化架構(gòu),推動了包括新型專用加速器、內(nèi)存子系統(tǒng)創(chuàng)新、能效聚焦及封裝與集成方式的演進(jìn)等。

Kevork Kechichian表示,我們正在見證芯片設(shè)計與制造模式的根本性變革——隨著新工藝節(jié)點(diǎn)需要更緊密的合作,芯片設(shè)計與制造之間的傳統(tǒng)界限正在逐漸消失。新的時代需要具備創(chuàng)造力、系統(tǒng)級思維,以及對能效的不懈追求。

軟件生態(tài)的挑戰(zhàn)

在軟件生態(tài)系統(tǒng)需求及AI框架迅速發(fā)展的推動下,AI的芯片生態(tài)系統(tǒng)正處于持續(xù)演進(jìn)的過程。

當(dāng)前,將AI模型移植到定制硬件面臨成本高、耗時長的挑戰(zhàn)。而CPU憑借其廣泛的普及性和對大多數(shù)AI推理工作負(fù)載的良好適配性,廣受開發(fā)者青睞。CPU的一致性有效避免了定制硬件可能出現(xiàn)的碎片化和低效率問題。此外,AI框架間的互操作性至關(guān)重要,CPU的普及性也有助于確保廣泛的兼容性。

由于AI開發(fā)缺乏標(biāo)準(zhǔn)化實踐,大量AI模型仍屬于私有模型,這不僅限制了開發(fā)者優(yōu)化性能的能力,也減緩了發(fā)展進(jìn)程。開放標(biāo)準(zhǔn)在打破這些壁壘的過程中發(fā)揮了關(guān)鍵作用,它使開發(fā)者能夠在不同平臺之間實現(xiàn)無縫遷移。

為培育一個蓬勃發(fā)展的開發(fā)者生態(tài)系統(tǒng),企業(yè)必須優(yōu)先通過強(qiáng)大的后端支持來賦能硬件,并積極擁抱不斷演進(jìn)的AI框架。Arm 在報告中給出了四點(diǎn)建議:善用通用工具以簡化開發(fā)流程,減少開發(fā)碎片化;提供預(yù)構(gòu)建的后端支持,通過為定制芯片提供“開箱即用”的兼容性,有助于加快其采用;積極參與開源框架的開發(fā),有助于確保兼容性并避免技術(shù)發(fā)展停滯不前;最后,隨著AI框架的快速演進(jìn),保持與最新技術(shù)同步對于維持競爭力至關(guān)重要。

結(jié)語

計算的未來,尤其是 AI 的未來,依賴于不斷拓展芯片技術(shù)的可能性邊界,依賴于軟硬件之間的協(xié)同。Kevork Kechichian強(qiáng)調(diào),擁抱開放標(biāo)準(zhǔn)、實現(xiàn)互操作性、提供強(qiáng)大工具支持,將加快創(chuàng)新步伐,釋放芯片技術(shù)與AI框架潛能。

他認(rèn)為,未來AI芯片解決方案的演進(jìn)將建立在一個統(tǒng)一、以開發(fā)者為中心的生態(tài)系統(tǒng)上,注重一致性、易獲取性和前瞻適應(yīng)性。而未來芯片設(shè)計的成功將越發(fā)依賴于五大關(guān)鍵點(diǎn):橫跨IP提供商、晶圓代工廠與系統(tǒng)集成商的緊密合作,計算-內(nèi)存-電源傳輸?shù)南到y(tǒng)級優(yōu)化,接口的標(biāo)準(zhǔn)化,面向特定負(fù)載的專用架構(gòu),以及能靈活應(yīng)對新興威脅的強(qiáng)大安全框架。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄