賈浩楠 發(fā)自 副駕寺,智能車參考 | 公眾號 AI4Auto
大家有沒有發(fā)現(xiàn),這幾個月所有主機廠、自動駕駛公司做技術宣傳時,不約而同提到一個新名詞:OCC,或者說占用網(wǎng)絡。
這是深度學習算法領域在自動駕駛的新應用,2023年10月,極越汽車首次在國內將OCC引入量產(chǎn)車。
而這項技術,也被認為是自動駕駛純視覺路線的一個重大進展,被解讀為“替代激光雷達”的最強殺手锏。
于是如今,不管理解沒理解,上車沒上車,搞自動駕駛的言必稱占用網(wǎng)絡。
而率先引入這個概念的極越汽車,剛剛把應用OCC的智駕方案推送給用戶,成為國內首個。
各家都在吹的OCC,極越已經(jīng)上車了
2月23日,極越正式向全量用戶OTA推送V1.3.1版本軟件。
這其中最種亮點最大的,就是的OCC占用網(wǎng)絡正式“上車”。極越也成為國內首個全量推送OCC占用網(wǎng)絡的車企。
之前,極越還有一個第一,就是國內首個實現(xiàn)“純視覺”技術方案量產(chǎn)的玩家,也是國內第一個明確走純視覺智能駕駛方案的車企。
還秀出了上海核心城區(qū)高峰期一鏡到底不接管的實測:
CEO夏一平,也在不久前親自上路直播展示了純視覺“點到點”的量產(chǎn)高階智駕能力:
這次的OCC上車,也是極越在純視覺技術路線上的一個超級重要的進展。
最具變革意義的是感知識別能力的提升,能夠對障礙物進行3D精細刻畫,模型精度可達厘米級,比肩甚至超越激光雷達。
同時,OCC占用網(wǎng)絡對于運動障礙物的速度識別精度能達到0.1米/秒誤差范圍。大幅提升了對于柵欄、護欄、水馬和施工隔離欄等有一定長度的通用障礙物邊界的識別能力,有效進行避讓、剎停等,留出更多安全行車距離。
OCC上車極越,對于用戶最直接的體驗提升,是城市、高速NOA功能更安全:
什么是OCC?上車有什么用?
OCC即Occupancy Network(占用網(wǎng)絡),最早由特斯拉提出。
系統(tǒng)的主要感知識別數(shù)據(jù)仍然是視覺圖像,攝像頭采集的數(shù)據(jù)通過基于Transformer的BEV網(wǎng)絡,應用自注意力機制進行特征提取,獲得當前場景各個目標的語義分割信息,并加入時序特征。
OCC的作用,是在傳統(tǒng)3D目標識別能力之上,通過體素(Voxel)化的方式理解和處理空間信息。
可以簡單理解為將場景空間分割成單位化的“方塊”,感知系統(tǒng)可以對3D空間的可通行區(qū)域進行高保真度還原。不需要考慮物體是什么,只考慮當下這個“方塊”是否被占用。
OCC除了替代激光雷達外,因為系統(tǒng)不需要識別出物體具體是什么,只需要知道自己是不是被阻擋了,所以也就不再像過去那樣依賴于訓練集。
實際其實占用網(wǎng)絡上車的一個初衷,是替代激光雷達。OCC帶來的“輕雷達”甚至是“去雷達”趨勢,可以使量產(chǎn)智駕系統(tǒng)的硬件成本降到極低,理論上能更快大規(guī)模普及。
視角再擴大一些,智能駕駛的成熟,解放用戶更多負擔,車上的自由時間和娛樂休閑辦公需求會爆發(fā),從而更加推動智能座艙技術、生態(tài)的發(fā)展。
可以做一個大膽的語言:
如果智能汽車、自動駕駛也存在“技術爆炸”的話,那么BEV、Transformer就是一直積蓄的能量,OCC可能就是引燃的“火種”。
極越走在了行業(yè)最前端,同時揭示了2024智能汽車內卷方向和主題。
智能車今年卷什么?
當然,OCC只是一個算法模塊,屬于極越“B.O.T三向箔”智駕技術體系的一部分。
B.O.T的意思是“BEV+OCC+Transformer”。這其中,Transformer是深度學習算法的基礎架構模型,尤其擅長處理自動駕駛連續(xù)圖像數(shù)據(jù)這樣的超大規(guī)模數(shù)據(jù)。
BEV也是一種數(shù)據(jù)處理算法,即在前端就利用環(huán)視攝像頭的數(shù)據(jù)連續(xù)生成車輛周圍360°的鳥瞰視角圖。
BEV圖像數(shù)據(jù)是帶有3D位置關系和時序因果關系的,這就從本質上改變了以往利用單幀圖像數(shù)據(jù)做訓練和感知的自動駕駛技術。
Transformer和BEV,最早由特斯拉提出,去年逐漸被國內玩家完全理解吸收,并且成為席卷自動駕駛業(yè)界、重構技術體系的浪潮。
比如華為ADS,從1.0的馬馬虎虎到2.0的“遙遙領先”,其實背后就是用BEV+Transformer重構了所有代碼。
毫無疑問,OCC是在Transformer和BEV之外,今年自動駕駛、智能汽車內卷的一個重要方向。
其他還有什么?
極越CEO夏一平和百度IDG技術委員會主席王亮給出了最新判斷。
首先是最近爆火的SORA,文生視頻的能力震撼所有人,是大模型威力從NLP向CV領域快速延伸的里程碑。
而作為CV領域應用最成熟、市場最廣闊的自動駕駛/智能汽車,自然要問:SORA會帶來什么樣的影響?
王亮認為,SORA本質是transformer機器學習的工具加上diffusion的技術。對自動駕駛的顛覆,可能是從預測的角度。
自動駕駛系統(tǒng)感知環(huán)境并構建,其實決策規(guī)劃不是建立在當下,而是對未來預判,可能是3秒可能是8秒。對未來預判越準,做的規(guī)劃就越合理。
SORA可以比較好預測未來60秒可能發(fā)生的事情。如果用SORA生成式技術,那么對未來的預測,包括決策規(guī)劃的影響會很巨大。
第三個重要趨勢,或者說是自動駕駛內卷方向,是預訓練模型。
自動駕駛的很多任務,檢測紅綠燈,檢測車道線,可分為兩個部分,backbone(提取特征),以及HED(解決具體任務)。
backbone很重要,但算力是有限的,且每個backbone能分配到的算力是平均的。
所以對感知來說需要有更強的視覺底座基礎模型,放到車上合并小模型,讓算力加大,從這個平臺上分出多個任務,讓每個任務解決的更好。
總結一下,極越或者說背后的百度Apollo,對于自動駕駛技術段內卷做出了預判。
首先是量產(chǎn)上車的層面,OCC成必爭之地,因為它是開啟智駕技術、體驗爆炸的鑰匙。
研發(fā)端的基礎設施——預訓練模型,成為一個玩家在這樣的內卷中能不能持續(xù)發(fā)力的關鍵。
而對于可能潛在的顛覆性SORA大模型,對自動駕駛的意義可能最先在“預測”這個模塊生效。
極越為什么能成?
百度是極越汽車背后的兩大“支柱”之一,這不是什么秘密。另一個是自主龍頭之一,也是目前國內最大的汽車集團吉利。
從極越新年首次OTA的內容中,就能看出極越為何能把智能汽車做到如此極致。
智駕方面,百度自動駕駛業(yè)務Apollo全力支持極越,IDG技術委員會主席王亮的團隊,不光把最強技術給了極越,還幾乎做到了兩個團隊“同吃同住同勞動”的高效率協(xié)作。
資源上,百度云業(yè)務給了極越自動駕駛開發(fā)的啟動算力1.8-2.2Eflops,上不封頂(特斯拉dojo發(fā)布時候的啟動算力1.1Eflops)。
另外智艙的文心一言大模型、百度地圖都給了極越100%支持。
極越的城市高階智駕功能,也馬上能做到“全國都能開”。背后是百度地圖革命性的升級。按照夏一平的說法,未來只要百度地圖能覆蓋的地方,極越PPA都能開。
當然還有吉利,現(xiàn)在也有跡象顯示出加大對極越的支持。
除了極越本身采用吉利浩瀚架構造車,在補能和用戶體驗上,現(xiàn)在也直接無縫對接吉利的資源。
比如今年3月,極越將打通共享極氪所有自建超充站,全國900多座,而且是800V。這會給極越所用用戶帶來出行體驗的質變。
智能汽車創(chuàng)業(yè),或者是車企智能化轉型,極越也走出一條獨特的公式:
必須有AI科技基因、能快速適應GPT,Sora等潮流,有自研、獨立開發(fā)能力;然后是汽車公司從制造方式創(chuàng)新,材料創(chuàng)新,平臺創(chuàng)新等一樣有不斷突破能力。
兩者加起來的車企,能脫穎而出。
極越就是這樣“AI頭部+創(chuàng)新型汽車集團支持”的企業(yè)。一直以來,定位都是最強AI技術(百度Apollo、文心一言),落在最強電動車平臺(吉利浩瀚SEA)。
現(xiàn)在極越展現(xiàn)出的趨勢,是技術越來越領先,體驗越來越靠譜。極越背后百度和吉利的支持,也越來越藏不住了。
而且這樣的支持,還有一個想象空間更大的觀察角度:
路特斯代表了吉利豪華品牌特性,極氪代表了吉利性能特性,而極越就是智能天花板特性的代表。
路特斯和極氪,相繼都實現(xiàn)了戰(zhàn)略目標,開始IPO進程,路特斯已經(jīng)成了,極氪馬上。
已經(jīng)實現(xiàn)智能戰(zhàn)略目標的極越,或許也快了…