作者 | 張馬也,編輯 | 德新
2025國(guó)產(chǎn)大算力芯片第一槍
2025年伊始,如果說(shuō)這年智能駕駛有什么確定性的關(guān)鍵詞,那「端到端智駕」與「大模型上車(chē)」一定是排序最靠前的那兩個(gè)。
上年末,一部分車(chē)企已經(jīng)推送了基于端到端大模型架構(gòu)的智駕系統(tǒng),而2025年將是端到端智駕開(kāi)始普及的年份。由端到端的神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的新一代智駕系統(tǒng),它不僅僅是車(chē)端算法的競(jìng)爭(zhēng),也是圍繞計(jì)算平臺(tái)、云端訓(xùn)練、數(shù)據(jù)閉環(huán)全鏈路的競(jìng)爭(zhēng)。作為車(chē)企發(fā)力端到端智駕的基石,高算力的智駕芯片,是其中核心的要素。
12月30日,黑芝麻智能發(fā)布新一代智能駕駛計(jì)算平臺(tái)——華山A2000家族,展現(xiàn)了其在高階智能駕駛領(lǐng)域的野心。目前,黑芝麻智能的計(jì)算平臺(tái)主要分為兩條線(xiàn):
一是武當(dāng)系列,以C1200家族為代表,將標(biāo)準(zhǔn)化的智能駕駛和座艙能力,融合到一個(gè)芯片中,幫助車(chē)企實(shí)現(xiàn)高性?xún)r(jià)比的艙駕融合,助力智駕普及;
二是華山系列,尤其A2000家族瞄準(zhǔn)行業(yè)最前沿的技術(shù),幫助車(chē)企落地最新的算法需求。
這次推出的華山A2000家族,就是黑芝麻針對(duì)新一代高階智駕的計(jì)算需求,給出的最優(yōu)解答。它包括三款產(chǎn)品,針對(duì)不同級(jí)別的智駕方案需求:
A2000 Lite,主打極致性?xún)r(jià)比,支持城市NOA解決方案;
A2000,作為新一代旗艦級(jí)的算力平臺(tái),支持各種復(fù)雜場(chǎng)景通識(shí)智駕;
A2000 Pro,進(jìn)一步翻倍算力和性能,面向高階全場(chǎng)景通識(shí)智駕甚至Robotaxi場(chǎng)景設(shè)計(jì)。
黑芝麻智能提出的全場(chǎng)景通識(shí)智駕概念,基于知識(shí)范式將駕駛場(chǎng)景的信息引入到知識(shí)增強(qiáng)的表示空間中,這些信息可以被推導(dǎo)為場(chǎng)景語(yǔ)義空間中的通用知識(shí),隨后通過(guò)知識(shí)的反映來(lái)推斷場(chǎng)景,從而指導(dǎo)實(shí)現(xiàn)更好的智能駕駛體驗(yàn)。
也就是說(shuō),讓AI模型具備人類(lèi)的常識(shí)和知識(shí),進(jìn)而影響場(chǎng)景里的決策,讓車(chē)開(kāi)得比老司機(jī)還好。通識(shí)智駕具備實(shí)現(xiàn)高級(jí)感知、決策和執(zhí)行的通用能力,能夠全面覆蓋城市道路、高速公路、晝夜變化以及各種氣候條件的不同場(chǎng)景。黑芝麻智能產(chǎn)品副總裁丁丁對(duì)HiEV表示,A2000家族的計(jì)算效率相較當(dāng)前主流旗艦芯片大幅領(lǐng)先,原生支持Transformer,整個(gè)產(chǎn)品組合覆蓋從NOA到Robotaxi的廣泛應(yīng)用場(chǎng)景。
A2000將很快向行業(yè)客戶(hù)提供開(kāi)發(fā)樣片,Lite和Pro也會(huì)稍晚陸續(xù)推出,預(yù)計(jì)2026年A2000將隨車(chē)企的量產(chǎn)車(chē)上市。盡管目前在國(guó)內(nèi)車(chē)市,中階和高階智駕正處在爆發(fā)的前夜,但真正能支持高階智駕落地,并且具備量產(chǎn)經(jīng)驗(yàn)的智駕計(jì)算平臺(tái)屈指可數(shù)。這不僅因?yàn)榍把b量產(chǎn),對(duì)芯片性能和穩(wěn)定性有著嚴(yán)苛要求,更在于它需要算法、工具鏈等整個(gè)生態(tài)系統(tǒng)的持續(xù)優(yōu)化和迭代。在「端到端」開(kāi)始量產(chǎn)的當(dāng)口,黑芝麻A2000家族的推出,可以說(shuō)來(lái)得「正是時(shí)候」。
兼具旗艦性能和超高性?xún)r(jià)比
武當(dāng)C1200家族是黑芝麻智能第一款基于7nm車(chē)規(guī)工藝設(shè)計(jì)的芯片,而A2000是第二款。黑芝麻智能副總裁丁丁告訴我們,正是基于此前的經(jīng)驗(yàn),A2000在7nm制程設(shè)計(jì)高算力芯片時(shí),能做到更極致的性能,芯片性耗比和性?xún)r(jià)比也有進(jìn)一步提升。
A2000集成了CPU、DSP、GPU、NPU、MCU、ISP和CV等多種計(jì)算單元,實(shí)現(xiàn)了高度集成化和單芯片多任務(wù)處理的能力。它使用新一代ISP技術(shù),具備4幀曝光和150dB HDR,提升了圖像處理能力,在隧道和夜間等場(chǎng)景下表現(xiàn)更好。
黑芝麻智能方面披露,A2000家族性能范圍能夠覆蓋目前主流應(yīng)用芯片的1 - 4倍。丁丁透露,基于上述3個(gè)產(chǎn)品版型的域控價(jià)格,也希望通過(guò)芯片的高集成度和成本優(yōu)勢(shì),能夠助力客戶(hù)相較原有系統(tǒng)有數(shù)千元級(jí)的下降。這在今天部分車(chē)企認(rèn)知高階智駕成本偏高的背景下,具備相當(dāng)不錯(cuò)的價(jià)格競(jìng)爭(zhēng)力,可以說(shuō)是高階市場(chǎng)的「性?xún)r(jià)比王者」。
以擴(kuò)展性和靈活性支持最前沿算法架構(gòu)
最近兩年內(nèi),智駕技術(shù)突飛猛進(jìn)。樂(lè)觀的業(yè)者預(yù)計(jì),一段式的端到端大模型可能在未來(lái)兩年內(nèi)量產(chǎn)上車(chē),甚至未來(lái)五年內(nèi),完全自動(dòng)駕駛的Robotaxi能開(kāi)始大規(guī)模普及。
丁丁也認(rèn)可當(dāng)前行業(yè)技術(shù)的演進(jìn)非常快,「在過(guò)去的一年,可以看到原來(lái)BEV+Transformer,并沒(méi)有停留那么長(zhǎng)時(shí)間,行業(yè)很快開(kāi)始了多模態(tài)大模型以及端到端的算法的落地嘗試?!笰2000的研發(fā)立項(xiàng)于2022年,針對(duì)智駕算法快速演進(jìn)的特點(diǎn),黑芝麻也在設(shè)計(jì)過(guò)程中,對(duì)A2000進(jìn)行了高度靈活的架構(gòu)布局,包括適應(yīng)當(dāng)下最新的模型結(jié)構(gòu)和算子類(lèi)型,同時(shí)也為未來(lái)的更新做好準(zhǔn)備。為A2000系列芯片提供性能底座的,是黑芝麻智能自研的全新NPU架構(gòu)「九韶」。
九韶NPU具有高算力、高能效和高帶寬的特點(diǎn),這是智能駕駛技術(shù)向更高階迭代的基礎(chǔ)。
相比于市面上部分NPU采用小核堆疊的方式設(shè)計(jì),九韶NPU采用了大核為主的架構(gòu)。通常,大核的設(shè)計(jì)相比于小核堆疊,能夠執(zhí)行更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型和算法,并且有更高的數(shù)據(jù)吞度量。丁丁告訴我們,「全新設(shè)計(jì)的一代大核架構(gòu),它特點(diǎn)是會(huì)算得非???,我們也加入了很多調(diào)度機(jī)制,讓它在多模型、多應(yīng)用的切換上,能夠以高效的方式執(zhí)行。」黑芝麻智能認(rèn)為,「大核會(huì)逐漸成為AI ASIC的主流?!?/p>
此外,九韶的內(nèi)存架構(gòu),也為高吞吐量和低延時(shí)專(zhuān)門(mén)優(yōu)化,包括大容量高帶寬的NPU專(zhuān)用緩存、核心模塊片內(nèi)共享緩存,以及對(duì)稱(chēng)的雙數(shù)據(jù)通路和專(zhuān)用DMA引擎,這樣一來(lái)既提升了性能和有效帶寬,降低了對(duì)外部存儲(chǔ)帶寬的依賴(lài),在性能、帶寬和成本之間極致平衡。NPU架構(gòu)不僅針對(duì)特定的算子或算法進(jìn)行優(yōu)化,而是更多從數(shù)據(jù)處理格式、計(jì)算方式上,對(duì)大量的卷積運(yùn)算、向量運(yùn)算等運(yùn)算核預(yù)留了可靈活配置可編程的能力。
在大模型強(qiáng)相關(guān)的數(shù)據(jù)架構(gòu)方面,針對(duì)不同的運(yùn)算核都進(jìn)行了數(shù)據(jù)流轉(zhuǎn)的優(yōu)化,以便在不同的運(yùn)算組合下,數(shù)據(jù)吞吐都不會(huì)成為計(jì)算的瓶頸。配合新一代大核架構(gòu)的NPU設(shè)計(jì),黑芝麻智能還推出了兩項(xiàng)技術(shù)創(chuàng)新以發(fā)揮大核的優(yōu)勢(shì):
新一代通用AI工具鏈BaRT;
新一代雙芯?;ヂ?lián)技術(shù)BLink。
BaRT是黑芝麻全新打造的工具鏈,支持多種神經(jīng)網(wǎng)絡(luò)的主流框架和模型轉(zhuǎn)化,并原生兼容PyTorch的推理API,支持Python編程部署,大大降低了開(kāi)發(fā)者的使用門(mén)檻,幫助車(chē)企對(duì)AI算法進(jìn)行快速遷移部署。BLink技術(shù)的引入,則為未來(lái)算力擴(kuò)展提供了靈活方案,支持Cache一致性互聯(lián)的高效芯片間通信,能夠擴(kuò)展支持更大規(guī)模模型的算力需求,為算法長(zhǎng)期演進(jìn)做好準(zhǔn)備。丁丁說(shuō),「能夠同時(shí)具備強(qiáng)大算力、完善工具鏈支持、成熟量產(chǎn)經(jīng)驗(yàn)的企業(yè)將在競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)。在同樣保證很高的性能和效率的前提下,我們會(huì)讓芯片具備更好的一個(gè)擴(kuò)展性和靈活性。它就會(huì)有更好更長(zhǎng)的生命周期,客戶(hù)的粘性也會(huì)更大。」
加速端到端量產(chǎn)
華山A2000,無(wú)論從架構(gòu)設(shè)計(jì),還是推出的市場(chǎng)節(jié)點(diǎn)來(lái)說(shuō),可以說(shuō)是為端到端而生的。丁丁認(rèn)為,多模態(tài)的大模型以及One Model的端到端模型,無(wú)疑是下一個(gè)階段的主旋律。
為此,黑芝麻也做了兩手準(zhǔn)備:
一方面,黑芝麻與第三方算法公司緊密合作,針對(duì)端到端模型以及新一代的計(jì)算平臺(tái)進(jìn)行移植開(kāi)發(fā)完整的智駕量產(chǎn)方案。這部分的工作預(yù)計(jì)明年上半年可以完成,并在實(shí)車(chē)上進(jìn)行測(cè)試驗(yàn)證。2026年將是華山A2000芯片全面普及的開(kāi)始。
另一方面,黑芝麻智能也在開(kāi)發(fā)高階的端到端參考方案。在A2000發(fā)布的前不久,黑芝麻智能推出支持華山及武當(dāng)芯片的端到端算法參考方案,這個(gè)參考模型可以讓更多客戶(hù)作為基礎(chǔ),在已經(jīng)和硬件優(yōu)化適配過(guò)的模型上,調(diào)整車(chē)企自有的算法,以及進(jìn)行進(jìn)一步的數(shù)據(jù)訓(xùn)練。該參考方案采用One Model架構(gòu),一端可輸入攝像頭、激光雷達(dá)、4D毫米波雷達(dá)、導(dǎo)航地圖等信息,另一端直接輸出駕駛決策所需要的信息,即本車(chē)的預(yù)期軌跡。整個(gè)方案在決策規(guī)劃單元引入了VLM視覺(jué)語(yǔ)言大模型,和PRR行車(chē)規(guī)則的概率化表征子模塊,進(jìn)一步提升了智駕系統(tǒng)的決策規(guī)劃能力。
目前,黑芝麻智能的端到端參考方案分為標(biāo)準(zhǔn)版和高階版兩個(gè)版本。前者在單顆武當(dāng)C1200家族中算力平臺(tái)上即可部署,而后者在華山A2000家族上運(yùn)行可以發(fā)揮出全部實(shí)力。之所以如此,是因?yàn)椤钢邱{都開(kāi)發(fā)周期越來(lái)越短,客戶(hù)更期待的不是單個(gè)芯片的能力,而是盡快獲得全棧的軟件算法和功能的支持」。不過(guò)從商業(yè)模式上,黑芝麻還是以服務(wù)客戶(hù)為目標(biāo),有一定的靈活度,主要還是提供給客戶(hù)更好用的工具,更接近產(chǎn)品化的參考。
今年,整個(gè)汽車(chē)行業(yè)在智能駕駛突飛猛進(jìn)的同時(shí),也經(jīng)歷了價(jià)格戰(zhàn)、倒閉、整合等風(fēng)波。但丁丁表示,他對(duì)行業(yè)的未來(lái)仍舊持樂(lè)觀的態(tài)度?!杠?chē)的數(shù)量并沒(méi)有少,并且在智駕的裝配率,尤其是高階智駕的裝配率上,一定是越來(lái)越多,所以我們還是非常樂(lè)觀」。
隨著端到端浪潮席卷而來(lái),華山A2000系列無(wú)疑將進(jìn)一步推動(dòng)黑芝麻出貨量的成長(zhǎng),鞏固其在智能駕駛計(jì)算解決方案領(lǐng)域的行業(yè)地位。