在C端,由智駕引發(fā)的事故被炒得沸沸揚(yáng)揚(yáng);而在B端,有關(guān)智駕的爭論也一直沒有停過。
在剛剛結(jié)束的2025電動(dòng)汽車百人會(huì)論壇上,蔚來汽車創(chuàng)始人李斌在談到ET9搭載的自研智駕芯片神璣NX9031時(shí)表示,研發(fā)這顆芯片投入的成本非常高,大概和建設(shè)1000座換電站差不多。
根據(jù)蔚來之前透露的信息,其初代換電站的成本約為300萬元/座,二代和三代則分別下降到了約200萬元、150萬元/座——換句話說,蔚來自研智駕芯片的成本可能已經(jīng)超過了15億元。
顯而易見的是,15億元的成本,對(duì)于像蔚來這樣的造車新勢力來說并不是一筆小數(shù)目,尤其是在已經(jīng)虧損纏身的情況下,不僅投資領(lǐng)域會(huì)擔(dān)心其風(fēng)險(xiǎn),市場端也或多或少會(huì)影響到消費(fèi)者的購車決策。
但除了蔚來以外,從去年開始,國內(nèi)各大傳統(tǒng)車企與造車新勢力都紛紛加入到了自研智駕芯片的大浪潮中。
去年10月,吉利發(fā)布了自研的星辰一號(hào)芯片,其采用7nm制程工藝,單顆NPU算力達(dá)512TOPS,計(jì)劃今年實(shí)現(xiàn)量產(chǎn),并在明年搭載至旗下高端車型。
去年11月,小鵬發(fā)布了自研的圖靈AI芯片,其綜合算力或超過750TOPS,號(hào)稱1顆頂3顆,1顆實(shí)現(xiàn)L3+高階智駕體驗(yàn),2顆實(shí)現(xiàn)L4自動(dòng)駕駛體驗(yàn)。
理想內(nèi)部也在推進(jìn)自研芯片項(xiàng)目,代號(hào)“舒馬赫”,設(shè)計(jì)制程為5nm,由臺(tái)積電代工。近期,理想團(tuán)隊(duì)內(nèi)部正在調(diào)整分工,NPU負(fù)責(zé)人的權(quán)力在逐漸加強(qiáng)。
面對(duì)車企的自研浪潮,最先發(fā)聲的并非投資人與消費(fèi)者,而是智駕芯片的國產(chǎn)供應(yīng)商們,在他們看來,車企此舉無疑是“為了一碟醋包了一盤餃子”。
由此問題就來了,供應(yīng)商為何要在自研智駕芯片這個(gè)問題上和車企“唱反調(diào)”?在車企“全民自研”的大環(huán)境下,供應(yīng)商是否擁有車企所不具備的優(yōu)勢呢?
智駕芯片,交給供應(yīng)商更好?
四維圖新CEO程鵬就在百人會(huì)論壇上表示,當(dāng)智能駕駛成為標(biāo)配,車企要找到自己的核心競爭力,其余部分則是供應(yīng)商的工作。
“你獨(dú)立的一家去做自研,性價(jià)比肯定不好。我也養(yǎng)那么多人,你也養(yǎng)那么多人,我給十家做同平臺(tái)的供貨,你一家自己做?!睂?duì)此,程鵬曾對(duì)另一家媒體算過一筆賬,平均一顆車規(guī)級(jí)芯片的研發(fā)成本,需要生產(chǎn)1500萬顆才能覆蓋。
程鵬這么說,當(dāng)然有他的邏輯。在他看來,很多車企在智能電動(dòng)車時(shí)代,都缺乏足夠的能力搭建AI工廠和數(shù)據(jù)處理能力——參考手機(jī)領(lǐng)域,像蘋果、華為這樣的頭部企業(yè)可以搭建自研的軟硬件生態(tài)系統(tǒng),其它品牌則擁抱安卓生態(tài)。
作為支撐,程鵬拿出了四維圖新目前的成績。憑借對(duì)數(shù)據(jù)的理解和采集能力以及合規(guī)能力,四維圖新能夠?qū)?shù)據(jù)變成合規(guī)層、數(shù)據(jù)增強(qiáng)層和AI的模型訓(xùn)練層,并開放給全行業(yè),這讓四維圖新到今年一季度截止,收獲了300萬套的車企定點(diǎn)。
除了四維圖新,黑芝麻智能首席市場營銷官楊宇欣也在百人會(huì)論壇上強(qiáng)調(diào)了第三方芯片供應(yīng)商仍的價(jià)值。他以特斯拉為例,表示特斯拉在HW3.0階段實(shí)現(xiàn)了芯片全自研,但在HW4.0階段卻將芯片設(shè)計(jì)交給了博通。
對(duì)此楊宇欣表示:“特斯拉的這一轉(zhuǎn)變表明,即使是行業(yè)領(lǐng)先者,也會(huì)在芯片設(shè)計(jì)上尋找最優(yōu)的商業(yè)合作模式。博通在團(tuán)隊(duì)成熟度、IP采購價(jià)格和代工價(jià)格上都比特斯拉更具優(yōu)勢。芯片行業(yè)的上游市場非?,F(xiàn)實(shí),一切都取決于量產(chǎn)規(guī)模,而非公司名氣?!?/p>
和程鵬一樣,楊宇欣也拿手機(jī)領(lǐng)域做了比喻,他認(rèn)為高通和聯(lián)發(fā)科這樣的供應(yīng)商,其手機(jī)芯片研發(fā)能力自然很強(qiáng);華為和三星這樣的頭部手機(jī)企業(yè),自研芯片也很不錯(cuò);而像谷歌這樣的手機(jī)廠商雖然也自研芯片,但只是部分自研,其很多設(shè)計(jì)還是會(huì)交給供應(yīng)商去做,所以第三方芯片供應(yīng)商是一定需要且一定長期需要的,畢竟大多數(shù)廠商還是希望能夠有更專業(yè)的供應(yīng)商提供支持。
作為對(duì)這一觀點(diǎn)的支撐,黑芝麻智能創(chuàng)始人兼CEO單記章以A2000系列芯片舉例,““我們用7nm的工藝,達(dá)到甚至超過了4nm工藝最先進(jìn)的芯片,A2000在絕對(duì)數(shù)值上跟國際巨頭不相上下的前提下,還能比他提供更高的效率。”而具體到合作,黑芝麻智能目前已經(jīng)和吉利、比亞迪、一汽、東風(fēng)等車企簽訂了合作協(xié)議,量產(chǎn)車型包括量產(chǎn)車型包括領(lǐng)克08、領(lǐng)克07、東風(fēng)eπ007、東風(fēng)eπ008等。
地平線創(chuàng)始人兼CEO余凱也在百人會(huì)論壇上發(fā)表了類似的言論。在他看來,自動(dòng)駕駛經(jīng)過發(fā)展,會(huì)成為一項(xiàng)非常標(biāo)準(zhǔn)化的功能,但也會(huì)導(dǎo)致很難再做出差異化。
余凱拿手機(jī)領(lǐng)域的經(jīng)驗(yàn)作比喻:“看手機(jī)過去30年的歷史,一開始基帶都是手機(jī)廠商自研的,像摩托羅拉、諾基亞、、愛立信。但從1995年開始,德州儀器掀起一波,2000年開始高通橫空出世。今天的局面是20%自研,80%依賴供應(yīng)商?!彼跃拖袷謾C(jī)廠商在過去十幾年的變遷一樣,自動(dòng)駕駛應(yīng)該也是車企自研占20%,供應(yīng)商合作占80%。
而對(duì)于地平線來說,截至目前地平線征程6已鎖定超20家車企及品牌量產(chǎn)合作,自2025年起有超100款搭載征程6的中高階智駕車型上市;量產(chǎn)規(guī)模加速擴(kuò)大,2025年征程家族累計(jì)出貨量將突破1000萬套,地平線也將成為國內(nèi)首個(gè)突破千萬級(jí)量產(chǎn)的智駕科技企業(yè)。
一邊是車企大力推動(dòng)自研智駕芯片,另一邊是供應(yīng)商希望車企積極擁抱第三方方案,那么研發(fā)智駕芯片的工作,究竟該交給誰更好?
車企:自研雖好,但考驗(yàn)內(nèi)功
如果說車企為什么要自研智駕芯片,那么特斯拉就是最好的答案。
以特斯拉的HW3.0為例,這套車端的硬件平臺(tái)搭載了兩顆特斯拉自研的FSD芯片,單顆算力僅為72 TOPS——顯然這一數(shù)值明顯低于同期的英偉達(dá)Orin(單顆254 TOPS)和高通Snapdragon Ride(約100+TOPS),但其效能優(yōu)勢卻異常突出,不僅可以運(yùn)行全場景FSD,甚至可以運(yùn)行FSD最新的端到端版本。
HW3.0之所以能憑借144TOPS的平臺(tái)算力“以小博大”,首先一大優(yōu)點(diǎn),就是其針對(duì)FSD軟件做了專屬優(yōu)化。早在2019年的Autonomy Day上,特斯拉芯片負(fù)責(zé)人Pete Bannon就表示,F(xiàn)SD芯片的能效比是競品的7倍,核心在于“為神經(jīng)網(wǎng)絡(luò)任務(wù)設(shè)計(jì),而非通用計(jì)算”。
FSD芯片包含三個(gè)模塊:
NPU(神經(jīng)網(wǎng)絡(luò)處理器):針對(duì)特斯拉的視覺算法(如Occupancy Network)定制優(yōu)化,直接處理攝像頭輸入的原始數(shù)據(jù),減少通用芯片的數(shù)據(jù)轉(zhuǎn)換開銷。
ISP(圖像信號(hào)處理器):實(shí)時(shí)處理8個(gè)攝像頭的1200萬像素圖像輸入,直接在芯片內(nèi)完成圖像預(yù)處理(如去噪、HDR),降低后端算力需求。
通用CPU/GPU:僅負(fù)責(zé)非核心任務(wù)(如邏輯控制),與NPU分工明確。
此外,F(xiàn)SD芯片還集成了32MB SRAM緩存,帶寬達(dá)2TB/s,避免了傳統(tǒng)GPU因訪問外部顯存帶來的延遲(典型GPU顯存帶寬為300-500GB/s)。對(duì)比之下,英偉達(dá)Orin的算力雖然更高,但其架構(gòu)需兼顧通用性(支持多車企的不同算法),實(shí)際運(yùn)行特斯拉同類算法時(shí),可能因數(shù)據(jù)搬運(yùn)和冗余計(jì)算損失效率。
對(duì)此,半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis指出,特斯拉HW3.0的實(shí)際有效算力(針對(duì)特定算法)相當(dāng)于300+ TOPS的通用GPU,驗(yàn)證了軟硬件協(xié)同優(yōu)化的價(jià)值。
另外一大優(yōu)點(diǎn),則是FSD軟硬件協(xié)同研發(fā)&優(yōu)化帶來的效率優(yōu)勢。比如軟硬件的深度綁定,根據(jù)特斯拉在2023年AI DAY上的披露,Occupancy Network可以直接利用FSD芯片的NPU進(jìn)行稀疏卷積計(jì)算,而通用芯片需通過CUDA等框架轉(zhuǎn)換為密集卷積,效率降低約30%。
此外還有軟件層減負(fù),根據(jù)Embedded Vision Alliance的報(bào)告顯示,特斯拉的底層驅(qū)動(dòng)和中間件(如Dojo編譯器)可以針對(duì)芯片指令集優(yōu)化,減少了操作系統(tǒng)和中間層的調(diào)度開銷。相比之下,基于Linux或QNX的自動(dòng)駕駛系統(tǒng)在通用芯片上運(yùn)行時(shí),需額外消耗5-10%的算力。
對(duì)此,大眾集團(tuán)前CEO赫伯特·迪斯曾公開表示,特斯拉在軟硬件垂直整合上的領(lǐng)先優(yōu)勢“至少為3-4年”。
但對(duì)于國內(nèi)車企來說,想要復(fù)制特斯拉的成功屬實(shí)困難,何況特斯拉也曾經(jīng)歷九死一生。
從技術(shù)層面來看,首先是芯片設(shè)計(jì)與算法協(xié)同的門檻依舊很高。例如特斯拉NPU的架構(gòu)與Occupancy Network等算法高度綁定,需同時(shí)精通芯片設(shè)計(jì)和AI算法優(yōu)化,而國內(nèi)車企普遍缺乏兩類人才的交叉培養(yǎng)(如既懂自動(dòng)駕駛算法又懂芯片微架構(gòu)的團(tuán)隊(duì)),這會(huì)導(dǎo)致軟硬件協(xié)同效率低下。
其次是國內(nèi)車企在數(shù)據(jù)閉環(huán)與算法迭代能力上,距離特斯拉依舊存在客觀差距。特斯拉通過全球超500萬輛車的影子模式收集數(shù)據(jù),每日處理數(shù)千萬個(gè)駕駛場景,支撐算法快速迭代,而國內(nèi)車企數(shù)據(jù)量級(jí)普遍不足,且數(shù)據(jù)標(biāo)注和仿真工具鏈相對(duì)落后;此外,特斯拉的Dojo超算集群算力達(dá)100 EFLOPS,可訓(xùn)練超百萬參數(shù)的大模型,而國內(nèi)車企多依賴公有云(如阿里云、AWS),訓(xùn)練成本相對(duì)高且效率低。
從資金層面來看,產(chǎn)投比也是絕大多數(shù)車企都難以平衡的問題。首先是流片成本與試錯(cuò)風(fēng)險(xiǎn),一款車規(guī)級(jí)芯片的研發(fā)投入約2-5億美元,需經(jīng)歷3-5次流片驗(yàn)證。國內(nèi)車企年銷量若不足50萬輛,分?jǐn)偟矫枯v車的芯片成本將超過1000元,遠(yuǎn)高于外采芯片(如英偉達(dá)Orin單價(jià)約400美元);對(duì)比之下,特斯拉憑借全球年銷180萬輛的規(guī)模,可將FSD芯片成本攤薄至每片約300美元,低于外購方案。
此外,盈利模式的單一也會(huì)拉長車企的“回本”周期,根據(jù)2023年的數(shù)據(jù)統(tǒng)計(jì),特斯拉通過FSD軟件分?jǐn)傂酒邪l(fā)成本,其全球FSD選裝率達(dá)19%;而國內(nèi)車企軟件付費(fèi)率普遍低于5%,且多數(shù)車企與用戶都選擇了免費(fèi)或低價(jià)訂閱的模式,這難以支撐芯片自研的長期投入。
供應(yīng)商:越發(fā)成熟,但仍需突破
那么面對(duì)車企自研智駕芯片的風(fēng)險(xiǎn),國產(chǎn)供應(yīng)商們有能力解決嗎?
我們先以地平線征為例。首先是已經(jīng)量產(chǎn)的征程5,這款芯片的算力達(dá)到了128 TOPS,但功耗僅有30W,能效比接近特斯拉FSD芯片,支持BEV+Transformer模型加速,適配車企的端到端算法需求。
此外,地平線提供“天工開物”工具鏈,支持車企將PyTorch/TensorFlow模型快速部署到征程芯片,壓縮模型計(jì)算量30%以上;針對(duì)中國城市場景,征程5還優(yōu)化了“動(dòng)態(tài)障礙物避讓”和“無保護(hù)左轉(zhuǎn)”的實(shí)時(shí)計(jì)算能力,讓時(shí)延低于100ms。
從量產(chǎn)表現(xiàn)看,征程5理想L系列搭載雙征程J5芯片,綜合算力達(dá)到256 TOPS,能夠?qū)崿F(xiàn)高速和部分場景下的城市NOA,且系統(tǒng)成本較英偉達(dá)方案降低40%。
其次是剛剛發(fā)布的征程6,性能層面,其單芯片算力達(dá)560 TOPS,支持多芯片級(jí)聯(lián)(最高2240 TOPS),內(nèi)置專用計(jì)算單元加速BEV+Occupancy Network,時(shí)延壓縮至50ms,接近特斯拉HW3.0水平;功耗層面,功耗層面,征程6的功耗控制在60W以內(nèi)(560 TOPS下),能效比約9.3 TOPS/W,接近特斯拉HW4.0。
此外,“天工開物”工具鏈新增自動(dòng)化模型剪枝和量化功能,車企算法團(tuán)隊(duì)可一鍵壓縮大模型,部署周期縮短50%。而在量產(chǎn)層面,征程6已官宣的合作車企包括比亞迪(高端品牌仰望U9)和廣汽埃安Hyper系列,計(jì)劃2025年量產(chǎn)。
從面向中端的征程5到面向高端的征程6,可以看出地平線在芯片算力、架構(gòu)、適配性、工具鏈等方面一直在針對(duì)車企的需求與智駕技術(shù)的迭代進(jìn)行升級(jí),以期達(dá)到更高的匹配程度;不過相對(duì)來說,其在軟硬件協(xié)同方面依舊存在局限性。
例如征程5,其在稀疏計(jì)算的加速能力上是弱于特斯拉FSD芯片的,這會(huì)導(dǎo)致實(shí)際有效算力折損約20-40%,另外由于缺乏類似特斯拉“Dojo編譯器”的底層優(yōu)化工具,車企需自研中間件,這也會(huì)增加開發(fā)周期和成本。
而對(duì)于征程6,除了在運(yùn)行復(fù)雜Occupancy Network時(shí),其有效算力或降至300-400 TOPS外,車企同樣需要自行適配算法,這也會(huì)導(dǎo)致車企無法通過地平線復(fù)刻特斯拉“芯片-算法-數(shù)據(jù)”的閉環(huán)優(yōu)勢。
然后再看看黑芝麻智能。其已經(jīng)量產(chǎn)的芯片為A1000系列,算力58 TOPS,其具備兩項(xiàng)優(yōu)勢,一個(gè)是多傳感器融合,A1000強(qiáng)化了對(duì)4D毫米波雷達(dá)的點(diǎn)云處理能力,這可以幫助車企減少對(duì)激光雷達(dá)的依賴;另一個(gè)是發(fā)布了山海工具平臺(tái),可以提供自動(dòng)化模型量化與編譯功能,進(jìn)而降低車企算法團(tuán)隊(duì)對(duì)芯片底層架構(gòu)的依賴。
對(duì)比之下,最新的A2000系列則將單芯片算力升級(jí)到了250 TOPS,支持4芯片級(jí)聯(lián)(1000 TOPS)。在固有優(yōu)勢方面,A2000更進(jìn)一步優(yōu)化了多模態(tài)融合能力,例如激光雷達(dá)點(diǎn)云處理時(shí)延從A1000的80ms降至30ms,支持動(dòng)態(tài)障礙物軌跡預(yù)測;而在開放性方面則提供“山海2.0”工具鏈,支持Apollo、Autoware等開源算法框架,適配二線車企的低成本開發(fā)需求。
但和地平線一樣,車企如果想要使用A1000與A2000系列,同樣需要投入大量資源適配算法,并且J6和A2000的級(jí)聯(lián)算力需外接多芯片,導(dǎo)致系統(tǒng)復(fù)雜度與功耗飆升,反而不如單芯片方案。
不過在技術(shù)層面之外,國產(chǎn)供應(yīng)商們?cè)谫Y金層面面對(duì)的困難也更值得我們關(guān)注。
以地平線為例,據(jù)地平線招股書(2023年赴港IPO申請(qǐng))顯示,2021-2023年累計(jì)虧損54億元,2023年凈虧損達(dá)18億元,毛利率僅35%;2023年經(jīng)營性現(xiàn)金流為-9.3億元,依賴外部融資輸血。2023年IPO前最后一輪融資估值50億美元,但上市進(jìn)程因盈利問題受阻,資金鏈壓力加劇。研發(fā)費(fèi)用占比超70%,但征程系列的年出貨量僅50萬片,單芯片研發(fā)成本分?jǐn)偢哌_(dá)4600元/片,遠(yuǎn)超售價(jià)。
黑芝麻的情況也不容樂觀。根據(jù)2023年財(cái)報(bào)顯示,黑芝麻智能凈虧損11.2億元,毛利率僅22%;2023年出貨量不足20萬片,且主要客戶為二線車企,前五大客戶貢獻(xiàn)營收占比超80%,抗風(fēng)險(xiǎn)能力弱。
這實(shí)際也反映出了國產(chǎn)供應(yīng)商們?cè)谏虡I(yè)模式上遇到了規(guī)模效應(yīng)難以達(dá)成的困境。例如地平線征程5和黑芝麻A1000為搶占市場份額,定價(jià)僅為英偉達(dá)Orin的30%-50%,但出貨量不足導(dǎo)致難以攤薄成本;由于國產(chǎn)芯片可替代性較高,車企也會(huì)要求芯片供應(yīng)商每年降價(jià)10%-15%,進(jìn)一步壓縮利潤空間。
此外,車規(guī)芯片認(rèn)證周期長達(dá)2-3年,導(dǎo)致地平線J6(16nm)和黑芝麻A2000(12nm)等先進(jìn)制程技術(shù)落地時(shí)已落后國際大廠;而為了吸引車企,供應(yīng)商還需要免費(fèi)提供工具鏈、算法優(yōu)化服務(wù),這類隱形成本占營收比例超25%。
由此可以看到,車企如果選擇集體自研智駕芯片,那么對(duì)供應(yīng)商的生存來說,無疑是釜底抽薪。不過在今年2月比亞迪宣布開啟全民智駕之后,不僅是比亞迪向英偉達(dá)和地平線分別發(fā)出了百萬片中算力智駕芯片的訂單,也引發(fā)了長安、奇瑞、吉利等品牌跟進(jìn)全民智駕的連鎖效應(yīng),這意味著供應(yīng)商們?cè)谥卸酥邱{芯片市場,依舊有重振雄風(fēng)的機(jī)會(huì)。
自研還是采購,終局將是生態(tài)分化
事實(shí)上,車企和供應(yīng)商圍繞智駕芯片的爭吵,本質(zhì)上是車企與供應(yīng)商對(duì)產(chǎn)業(yè)話語權(quán)的爭奪,雖然車企在明面上依舊擁有更大的主導(dǎo)權(quán),但確實(shí)如供應(yīng)商所言,從長遠(yuǎn)看,這場博弈的終局大概率會(huì)形成生態(tài)分層:
如特斯拉、比亞迪等這般年銷量達(dá)百萬級(jí)的頭部車企,憑借規(guī)模效應(yīng)和技術(shù)閉環(huán)能力,確實(shí)可通過自研智駕芯片構(gòu)建護(hù)城河。特斯拉的FSD芯片已驗(yàn)證了軟硬件協(xié)同的顛覆性效率,而比亞迪若成功量產(chǎn),將打破對(duì)英偉達(dá)的依賴。這類企業(yè)追求的不僅是功能領(lǐng)先,更是對(duì)數(shù)據(jù)、算法、硬件的全鏈條控制。
對(duì)年銷量50萬以下的車企,自研芯片的財(cái)務(wù)和技術(shù)風(fēng)險(xiǎn)遠(yuǎn)超收益。地平線、黑芝麻等供應(yīng)商提供的“高性價(jià)比芯片+工具鏈”,仍是其實(shí)現(xiàn)智駕功能的最優(yōu)解。但需警惕供應(yīng)商生態(tài)的局限性——若無法突破算力天花板或綁定頭部客戶,這類芯片可能淪為“過渡方案”。
對(duì)于供應(yīng)商來說,生存邏輯則更加直接,取決于兩點(diǎn):一個(gè)是加速追趕技術(shù)代差,例如地平線J6、黑芝麻A2000需證明其實(shí)際有效算力不輸英偉達(dá)Thor,并通過開放生態(tài)擴(kuò)大適配性;另一個(gè)則是更新商業(yè)模式,例如從“賣芯片”轉(zhuǎn)向“賣服務(wù)”,按車企智駕功能開通率分成(類似特斯拉FSD訂閱),或與云服務(wù)捆綁(如四維圖新數(shù)據(jù)合規(guī)方案)。
對(duì)車企的終極拷問并非“是否自研芯片”,而是“能否在智能化競爭中存活”。若既無規(guī)模也無技術(shù)深度,跟風(fēng)自研只會(huì)加速失血;若志在頭部,則必須忍受短期虧損,賭一個(gè)“特斯拉式”的未來。而供應(yīng)商的生存之道,則在于能否在巨頭夾縫中,找到不可替代的生態(tài)位——無論是極致性價(jià)比,還是差異化服務(wù)。這場博弈沒有標(biāo)準(zhǔn)答案,唯有時(shí)間能篩選出最后的贏家。