作者 |??程茜,編輯?|??Panken
用全國(guó)產(chǎn)封裝供應(yīng)鏈搞定Chiplet異構(gòu)集成,這家創(chuàng)企已經(jīng)率先完成產(chǎn)品驗(yàn)證,對(duì)話北極雄芯創(chuàng)始人。
又有一家“清華系”前沿芯片創(chuàng)企浮出水面。
本月初,國(guó)內(nèi)Chiplet芯片設(shè)計(jì)創(chuàng)企北極雄芯宣布完成新一輪超億元融資。這是繼去年10月獲得1.5億元天使輪融資后,北極雄芯拿下的又一筆億級(jí)融資。韋豪創(chuàng)芯、中芯熙誠(chéng)、訊飛創(chuàng)投、豐年資本、正為資本均在其股東陣容。
這家2021年7月成立的年輕創(chuàng)企,在今年2月推出了國(guó)內(nèi)首款基于異構(gòu)Chiplet集成的智能處理芯片“啟明930”,成為國(guó)內(nèi)第一家流片成功Chiplet異構(gòu)集成AI芯片的公司。
▲啟明930實(shí)物(左)、啟明930板卡(右)
北極雄芯的創(chuàng)始人、首席科學(xué)家馬愷聲,是清華大學(xué)交叉信息研究院助理教授、博士生導(dǎo)師。圖靈獎(jiǎng)得主、中科院院士、清華大學(xué)交叉信息研究院院長(zhǎng)姚期智,現(xiàn)任北極雄芯的首席科學(xué)顧問。
過去四年,馬愷聲帶領(lǐng)團(tuán)隊(duì)在架構(gòu)拆分設(shè)計(jì)、高速互聯(lián)接口、國(guó)產(chǎn)供應(yīng)鏈封裝等各項(xiàng)Chiplet基礎(chǔ)技術(shù)研發(fā)層面取得了一系列成功。
英偉達(dá)A100、AMD MI300、特斯拉D1、蘋果M1 Ultra等經(jīng)典AI芯片產(chǎn)品均采用了Chiplet架構(gòu)?;贑hiplet架構(gòu)的高性能解決方案,能夠有效降低云邊端AI芯片的設(shè)計(jì)門檻,潛在市場(chǎng)規(guī)模巨大。而馬愷聲對(duì)此積累頗深。
近日,芯東西與這位國(guó)內(nèi)Chiplet領(lǐng)域的前沿學(xué)者進(jìn)行了一場(chǎng)深度對(duì)話,不僅回顧了其如何前瞻性地選擇在Chiplet賽道創(chuàng)業(yè),還解讀了北極雄芯背后的核心技術(shù)積累。
01.用Chiplet架構(gòu)解決行業(yè)痛點(diǎn)三年積累迎來產(chǎn)業(yè)風(fēng)口
馬愷聲與Chiplet的緣分,是在加入清華后開始的。
2018年,從賓夕法尼亞州立大學(xué)畢業(yè)后,馬愷聲進(jìn)入清華大學(xué)交叉信息核心技術(shù)研究院,成為其中除量子芯片外主攻應(yīng)用芯片研發(fā)的“第一人”。在這里,眾多專家專注于研究AI在不同行業(yè)的應(yīng)用,所涉及的場(chǎng)景及算法差異性極大,而馬愷聲負(fù)責(zé)底層硬件支持?!鞍凑彰?-3年做一款A(yù)I芯片的進(jìn)度,我得做幾十年?!瘪R愷聲說,這樣的研發(fā)速度,對(duì)于飛速發(fā)展的AI行業(yè)而言,只能是杯水車薪。
恰巧在這時(shí),電動(dòng)汽車的滑板底盤技術(shù)給了他靈感。
所謂滑板底盤,就是將電動(dòng)車的制動(dòng)、懸架、電動(dòng)傳動(dòng)、電池等部件以模塊化形式集成,這樣不同車型可以根據(jù)需求組裝相應(yīng)模塊。
無獨(dú)有偶。蘇州芯片創(chuàng)企貝塔微打造的工具,可以低成本快速批量生產(chǎn)芯片,與半導(dǎo)體產(chǎn)業(yè)頭部玩家德州儀器的電源管理芯片DC-DC、AC-DC搶市場(chǎng)。
在這些啟發(fā)下,馬愷聲開始集中琢磨一個(gè)問題:怎么能快速、低成本的做芯片,還能滿足AI+各行各業(yè)的需求。
Chiplet,就這樣闖進(jìn)了馬愷聲的研究主線。
Chiplet常被譯為“芯?!薄ⅰ靶⌒酒?,通過將一整顆SoC的功能模塊解耦,分別設(shè)計(jì)制造采用不同制程工藝的chiplets,再通過2.5D/3D先進(jìn)封裝技術(shù)集成在一起。這種異構(gòu)集成的設(shè)計(jì)理念,不僅有助于降低芯片研發(fā)成本,而且能夠有效緩解各行業(yè)算力需求方在差異化需求、性能、成本、算法迭代周期、供應(yīng)鏈保障等各方面的核心痛點(diǎn)。
嗅到巨大商業(yè)價(jià)值后,2019年,馬愷聲意氣風(fēng)發(fā)地率領(lǐng)團(tuán)隊(duì)投入Chiplet研發(fā)。
早期依托于西安交叉信息核心技術(shù)研究院的孵化支持,團(tuán)隊(duì)完成了啟明910、啟明920等幾代AI加速模塊的研發(fā);2021年7月,北極雄芯公司成立并獲得圖靈創(chuàng)投、SEE Fund、紅杉等天使輪投資,馬愷聲正式踏上創(chuàng)業(yè)之路。
2022年初,Intel、AMD等國(guó)際半導(dǎo)體產(chǎn)業(yè)巨頭成立Chiplet產(chǎn)業(yè)聯(lián)盟發(fā)布UCIe 1.1規(guī)范,Chiplet在市場(chǎng)上的關(guān)注度漸起。
一切開始步入正軌。
02.主攻云邊端AI推理智能駕駛成重點(diǎn)突破口
理想很豐滿,現(xiàn)實(shí)卻很骨感。
“在芯片領(lǐng)域,大家都很保守,你不把(產(chǎn)品)跑通,客戶看不到產(chǎn)品就會(huì)選擇觀望,不會(huì)貿(mào)然采用Chiplet路線?!瘪R愷聲說。
實(shí)際操作中,不同場(chǎng)景的需求并不收斂,如何在不同場(chǎng)景的硬件需求中找到最大交集?如何有效的解耦其中共性的部分以及差異化的部分?這是做Chiplet無法繞開的一大難題。
帶著這樣的思考,馬愷聲聯(lián)合團(tuán)隊(duì)深挖潛在客戶需求,綜合考慮Chiplet的技術(shù)特性和經(jīng)濟(jì)效益后,北極雄芯將選擇先從云邊端AI推理入手,以AI加速和智能駕駛為重點(diǎn)場(chǎng)景突破口,先做出具有代表性的Chiplet架構(gòu)芯片,再通過方案授權(quán)或聯(lián)合研發(fā)等方式向其它行業(yè)拓展。
▲Chiplet技術(shù)演示(圖源:北極雄芯官網(wǎng))
例如在智能駕駛領(lǐng)域,單一芯片很難同時(shí)兼顧不同檔次車型在產(chǎn)品差異化、迭代周期、成本控制上的需求;AI推理加速方面,市場(chǎng)對(duì)高性能算力的需求將從“通用化”向“專用化”轉(zhuǎn)變。這些趨勢(shì)都與Chiplet架構(gòu)將大型SoC芯片的模塊拆分成芯粒的技術(shù)路線相契合。
“無論是人工智能服務(wù)器,還是智能駕駛高性能計(jì)算平臺(tái),我們看到的均是千億級(jí)別的潛在市場(chǎng),并且認(rèn)為Chiplet架構(gòu)在其中能夠提供獨(dú)特的商業(yè)價(jià)值?!瘪R愷聲對(duì)Chiplet的商業(yè)價(jià)值及市場(chǎng)前景非常樂觀。
03.兩年半跑通首顆Chiplet芯片筑起三大核心技術(shù)壁壘
“從設(shè)計(jì)、制造、互聯(lián)、封裝、工具鏈等全部跑通,在這件事上,我們應(yīng)該是國(guó)內(nèi)第一家。”馬愷聲談道。今年2月,北極雄芯發(fā)布了首個(gè)基于Chiplet架構(gòu)的“啟明930”芯片,可用于AI推理、工業(yè)智能等不同場(chǎng)景。
啟明930基于12nm工藝,采用了北極雄芯自研的第三代“MUSE”核心架構(gòu)NPU,搭配北極雄芯構(gòu)筑的完整算法、編譯、軟件工具鏈體系,使得自研NPU在主流AI模型應(yīng)用上的平均芯片利用率超過70%。
這是首個(gè)基于Chiplet異構(gòu)集成并完成流片及國(guó)產(chǎn)封裝全鏈路成功驗(yàn)證的高性能計(jì)算SoC,中央控制芯粒采用RISC-V CPU核心,同時(shí)可通過高速接口搭載多個(gè)功能型芯粒,做到8~20T的算力靈活拓展,支持主流AI算子。
目前,啟明930已與多家AI下游場(chǎng)景合作伙伴進(jìn)行測(cè)試。
由于基于全國(guó)產(chǎn)基板材料以及2.5D封裝,啟明930的成本更加可控。北極雄芯還提供了與其芯片配套的基礎(chǔ)驅(qū)動(dòng)、框架支持、應(yīng)用層全棧式的應(yīng)用部署工具。
“把十幾個(gè)小芯粒封裝在一起,并且部署相應(yīng)的任務(wù),這塊芯片能跑通,是一個(gè)非常復(fù)雜的工程?!瘪R愷聲感慨道,“如何在架構(gòu)定義層面進(jìn)行縱向拆解?需要支持哪些算法?在哪個(gè)模塊做?IP如何集成?如何實(shí)現(xiàn)高速互聯(lián)通訊?如何解決應(yīng)力問題?如何解決供電散熱材料?”……最后,北極雄芯聯(lián)合將近10家廠商一起才跑通了啟明930。
據(jù)他回憶:“啟明930從研發(fā)、流片、回片,折騰了將近兩半年的時(shí)間?!?,因?yàn)橹皬奈从腥送暾脑趪?guó)產(chǎn)供應(yīng)鏈跑通全部。
在這背后,北極雄芯積累了三大核心技術(shù)。
一是“拆”,明確Chiplet的拆解與定義;二是“連”,解決Chiplet的互連與通信;三是“封”,負(fù)責(zé)Chiplet與封裝優(yōu)化。
其中,基于芯粒劃分方法學(xué),能降低跨芯粒數(shù)據(jù)通信負(fù)擔(dān);采用低“芯粒稅”的架構(gòu)定義,可以降低芯?;瘞淼拿娣e負(fù)擔(dān);內(nèi)部Chiplet-Actuary成本模型,能實(shí)現(xiàn)高性價(jià)比復(fù)用。
▲北極雄芯對(duì)于Chiplet的拆解與定義
北極雄芯自主研發(fā)的PBLink D2D互連接口,能實(shí)現(xiàn)高速高帶寬與低延時(shí)的芯粒通信,同時(shí)符合國(guó)內(nèi)《芯?;ヂ?lián)接口標(biāo)準(zhǔn)》及車規(guī)級(jí)D2D接口標(biāo)準(zhǔn)。
在封裝方面,為了促進(jìn)供應(yīng)鏈國(guó)產(chǎn)化,低線數(shù)的PBLink D2D接口可以滿足國(guó)內(nèi)基板的層數(shù)要求(≤8層),多芯粒與封裝協(xié)同布局同步優(yōu)化封裝利用率等。
04.預(yù)告芯片量產(chǎn)路線圖下一代Chiplet產(chǎn)品正在緊密研發(fā)
基于產(chǎn)學(xué)研結(jié)合的多年積累,北極雄芯已經(jīng)完成了首個(gè)基于Chiplet異構(gòu)集成芯片的試生產(chǎn)驗(yàn)證,并向下游客戶交付了首個(gè)隱私安全計(jì)算芯粒產(chǎn)品。
北極雄芯也陸續(xù)與經(jīng)緯恒潤(rùn)、海星智駕、山東云海國(guó)創(chuàng)等多家下游場(chǎng)景方達(dá)成戰(zhàn)略合作,致力于共同推動(dòng)Chiplet在智能駕駛、AI服務(wù)器等各行業(yè)場(chǎng)景的應(yīng)用。
馬愷聲認(rèn)為,Chiplet的市場(chǎng)發(fā)展已經(jīng)很清晰,他預(yù)計(jì)到2030年,超過一半的高性能AI計(jì)算芯片以及智能駕駛相關(guān)主控芯片均會(huì)采用Chiplet架構(gòu)。
市場(chǎng)研究機(jī)構(gòu)Omdia的數(shù)據(jù)也顯示,到2024年Chiplet的市場(chǎng)規(guī)模將達(dá)到58億美元,2035年市場(chǎng)規(guī)模將進(jìn)一步擴(kuò)大到570億美元。
目前北極雄芯正投入下一代高性能通用型芯粒以及AI計(jì)算芯粒的研發(fā)。據(jù)馬愷聲透露,其下一代產(chǎn)品預(yù)計(jì)將于2024年回片測(cè)試成功并開始小規(guī)模量產(chǎn),預(yù)計(jì)將率先在部分高性能計(jì)算、商專車、低速無人駕駛等場(chǎng)景實(shí)現(xiàn)小批量使用,并按節(jié)奏逐步進(jìn)入乘用車智能駕駛領(lǐng)域。
面向未來,當(dāng)下蓬勃發(fā)展的大模型、機(jī)器人產(chǎn)業(yè),也讓馬愷聲看到了Chiplet落地應(yīng)用的諸多機(jī)遇。
不同于此前人形機(jī)器人的傳統(tǒng)控制算法,現(xiàn)在人形機(jī)器人采用端到端控制,基于模型輸出電機(jī)怎么轉(zhuǎn)的指令。
這樣一來,機(jī)器人的每個(gè)自由度都是一個(gè)電機(jī),每個(gè)電機(jī)都需要一套模型,模型的計(jì)算速度要更快,才能讓機(jī)器人收到反饋、做指令更靈活。
此外,大模型包含訓(xùn)練和推理的需求,可能兩年之后,隨著產(chǎn)業(yè)發(fā)展較為成熟,推理需求將進(jìn)一步被釋放出來。
在這些機(jī)遇中,基于國(guó)內(nèi)尚有差距的供應(yīng)鏈、工藝等,如何做出高性價(jià)比的系統(tǒng),是北極雄芯要做的事。這些擁有巨大潛力的應(yīng)用場(chǎng)景的出現(xiàn),也為馬愷聲繼續(xù)探索Chiplet增添了更多動(dòng)力。
05.拆解Chiplet發(fā)展三大攔路虎發(fā)布國(guó)產(chǎn)供應(yīng)鏈Chiplet互聯(lián)標(biāo)準(zhǔn)
對(duì)于國(guó)內(nèi)Chiplet發(fā)展面臨的挑戰(zhàn),馬愷聲重點(diǎn)談及三個(gè)環(huán)節(jié)。
首先是生產(chǎn)制造環(huán)節(jié),如何盡可能基于國(guó)內(nèi)自主可控的供應(yīng)鏈實(shí)現(xiàn)Chiplet芯片的量產(chǎn),擺脫受制于國(guó)外先進(jìn)制程的枷鎖,用國(guó)內(nèi)成熟制程工藝技術(shù)實(shí)現(xiàn)滿足需求的性能。
其次是如何拆分芯片模塊,并通過不同工藝制程生產(chǎn),使其商業(yè)化達(dá)到最優(yōu)。
還有封測(cè)環(huán)節(jié),國(guó)內(nèi)封裝基本材料與國(guó)外存在差距,先進(jìn)封裝的量產(chǎn)成本高,因此做Chiplet既要考慮通過國(guó)產(chǎn)封裝供應(yīng)鏈來優(yōu)化芯粒、接口設(shè)計(jì),還要考慮成本。
難題擺在眼前,北極雄芯也在積極推進(jìn)Chiplet接口標(biāo)準(zhǔn)的制定。
早在2020年,其團(tuán)隊(duì)即與國(guó)內(nèi)上下游共同建立了中國(guó)Chiplet產(chǎn)業(yè)聯(lián)盟(CCLL),專注于Chiplet架構(gòu)在各領(lǐng)域應(yīng)用的前沿探索。今年年初,交叉信息核心技術(shù)研究院牽頭、中國(guó)Chiplet產(chǎn)業(yè)聯(lián)盟共同起草的《芯?;ヂ?lián)接口標(biāo)準(zhǔn)》ACC 1.0高速串口標(biāo)準(zhǔn)與《車規(guī)級(jí)芯粒互連接口標(biāo)準(zhǔn)》ACC_RV 1.0正式發(fā)布。
下載鏈接:http://accchiplet.iiisct.com/
相比于UCIe標(biāo)準(zhǔn),ACC標(biāo)準(zhǔn)更關(guān)注針對(duì)國(guó)產(chǎn)供應(yīng)鏈的優(yōu)化,適合對(duì)供應(yīng)鏈自主可控程度要求高、量產(chǎn)成本敏感的下游領(lǐng)域,能滿足其商業(yè)落地的需求。
馬愷聲坦言,雖然UCIe已經(jīng)發(fā)布一段時(shí)間,但市場(chǎng)上至今還沒有相對(duì)成熟的支持所有頻點(diǎn)的滿足標(biāo)準(zhǔn)的產(chǎn)品,而真正下場(chǎng)做各個(gè)“芯?!钡钠髽I(yè)更是寥寥無幾。
他認(rèn)為,標(biāo)準(zhǔn)應(yīng)該先讓大家能用起來,基于各場(chǎng)景的真實(shí)商業(yè)需求以及國(guó)內(nèi)相關(guān)供應(yīng)鏈的完備程度來制定標(biāo)準(zhǔn)。往后看,北極雄芯計(jì)劃進(jìn)一步投入高速互聯(lián)芯粒接口等Chiplet基礎(chǔ)技術(shù)的研發(fā)。
在這個(gè)過程中,他將Chiplet的發(fā)展和工藝進(jìn)步看作“正交”關(guān)系,在工藝制程發(fā)展受光刻機(jī)等關(guān)鍵設(shè)備及半導(dǎo)體材料制約的情況下,接下來10-15年內(nèi),Chiplet或許會(huì)貢獻(xiàn)出不一樣的東西。
06.結(jié)語:高性能計(jì)算Chiplet需求漸起國(guó)內(nèi)新生勢(shì)力挑起大梁
北極雄芯希望在Chiplet產(chǎn)業(yè)中扮演怎樣的角色?馬愷聲用一句話加以概括:“北極雄芯希望基于國(guó)產(chǎn)化的供應(yīng)鏈,用最大的自主可控程度,做出不錯(cuò)的系統(tǒng)應(yīng)用?!?/p>
如今北極雄芯的核心研發(fā)團(tuán)隊(duì),已經(jīng)聚集了有中興、華為、紫光、英特爾、Cadence、Marvell等國(guó)內(nèi)外知名半導(dǎo)體企業(yè)背景,擁有不同工藝多款芯片成功流片經(jīng)驗(yàn)的一批芯片人才。
隨著系統(tǒng)級(jí)芯片集成進(jìn)入后摩爾時(shí)代,加上國(guó)內(nèi)先進(jìn)制程供應(yīng)受阻,基于Chiplet的創(chuàng)新思路成為國(guó)內(nèi)半導(dǎo)體產(chǎn)業(yè)發(fā)展的重要途徑。在時(shí)代浪潮中,北極雄芯致力于成為基于Chiplet架構(gòu)定制化高性能計(jì)算解決方案的領(lǐng)航者,從AI在各領(lǐng)域落地的實(shí)際應(yīng)用需求出發(fā),協(xié)助各行業(yè)“用小芯片,做大芯片”。
在今年9月14日-15日舉行的2023全球AI芯片峰會(huì)期間,馬愷聲教授將對(duì)Chiplet架構(gòu)在AI芯片中的商業(yè)價(jià)值進(jìn)行進(jìn)一步的深入解讀,分享推動(dòng)Chiplet架構(gòu)在國(guó)內(nèi)的商業(yè)化落地以及創(chuàng)造新的高性能計(jì)算范式,并介紹北極雄芯在Chiplet領(lǐng)域的拓展及實(shí)踐。