自動(dòng)駕駛算法誰家強(qiáng)？零跑上汽并列第一

2023/10/25 作者：佐思產(chǎn)研

2752

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

目前，學(xué)術(shù)圈還是用“打榜”來對(duì)自動(dòng)駕駛算法評(píng)分。所謂“打榜”就是在某一數(shù)據(jù)集上利用其訓(xùn)練數(shù)據(jù)集來測(cè)試算法的優(yōu)劣，目前自動(dòng)駕駛?cè)?nèi)最常用的打榜數(shù)據(jù)集是安波福Aptiv旗下的nuScenes。嚴(yán)格意義上的自動(dòng)駕駛算法評(píng)分對(duì)比幾乎是不可能的，單獨(dú)對(duì)比算法不夠公允，此外還必須考慮算法的效率和落地可行性。訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)也會(huì)影響算法的發(fā)揮。同時(shí)由于深度學(xué)習(xí)的不可解釋性，在nuScenes數(shù)據(jù)集上表現(xiàn)好不代表在其他數(shù)據(jù)集也會(huì)表現(xiàn)好，也許會(huì)表現(xiàn)得很差，同樣道理在nuScenes數(shù)據(jù)集上表現(xiàn)不好不代表在其他數(shù)據(jù)集也表現(xiàn)不好。當(dāng)然算力大小無關(guān)算法的準(zhǔn)確度。

nuScenes數(shù)據(jù)集的任務(wù)包括六大類，分別是3D目標(biāo)檢測(cè)detection、目標(biāo)追蹤tracking、目標(biāo)軌跡預(yù)測(cè)prediction、激光雷達(dá)目標(biāo)分割lidar segmentation、全景panoptic、決策planning。其中，3D目標(biāo)檢測(cè)是自動(dòng)駕駛最基礎(chǔ)的任務(wù)，全球有近300個(gè)團(tuán)隊(duì)或企業(yè)參加了比試，也是全球自動(dòng)駕駛數(shù)據(jù)集參賽者最多的，足見其權(quán)威性。決策任務(wù)的榜單還沒有公布，因?yàn)榇虬竦娜颂倭?。目?biāo)追蹤、目標(biāo)軌跡預(yù)測(cè)參與熱度相對(duì)還比較高，而激光雷達(dá)目標(biāo)分割和全景參與熱度就很低了，不到20家參與。

近期打榜的基本都是中國企業(yè)或高校，除了中國，其他地區(qū)對(duì)自動(dòng)駕駛?cè)狈εd趣，即便在美國，研究自動(dòng)駕駛的基本都是華人。很少有車企會(huì)參與打榜，早期還有奔馳、博世等企業(yè)參加，奔馳的成績慘不忍睹，博世還不錯(cuò)。車企不參加打榜的原因很簡單，成績好消費(fèi)者也不知情，成績差的話就會(huì)被競(jìng)爭(zhēng)對(duì)手拿來攻擊，干脆不參與，要參與就是對(duì)自己的能力非常自信，就比如零跑和上汽。

前15名如下：

資料來源：公開信息整理

nuScenes數(shù)據(jù)集的靈感來自開創(chuàng)性的KITTI數(shù)據(jù)集（豐田與德國KIT于2012年完成）。nuScenes是首個(gè)提供自動(dòng)駕駛汽車整個(gè)傳感器套件(6個(gè)攝像頭、1個(gè)LiDAR、5個(gè)Radar、GPS、IMU)數(shù)據(jù)的大規(guī)模數(shù)據(jù)集。與KITTI相比，nuScenes包含了7倍多的對(duì)象注釋。完整的數(shù)據(jù)集包括大約1.4M相機(jī)圖像（camera images），390k激光雷達(dá)掃描（LiDAR sweeps），1.4M雷達(dá)掃描（Radar sweeps）和1.4M物體邊界框（object
bounding boxes）在40k關(guān)鍵幀。為方便常見的計(jì)算機(jī)視覺任務(wù)，如對(duì)象檢測(cè)和跟蹤，在整個(gè)數(shù)據(jù)集上以2Hz的速度用精確的3D包圍框注釋了23個(gè)對(duì)象類；還注釋了對(duì)象級(jí)屬性，如可見性、活動(dòng)和姿勢(shì)。

如果只用相機(jī)也就是純視覺，地平線的Sparse4D包攬第一名和第二名。曠視的FAR3D是第三名，商湯和香港大學(xué)、哈爾濱工業(yè)大學(xué)等聯(lián)合的HOP第四名，豐田排名第五。純視覺的效果比視覺和激光雷達(dá)融合的效果落后不少，但純激光雷達(dá)的效果與視覺和激光雷達(dá)融合后的效果相差甚微。

3D目標(biāo)檢測(cè)的得分共六項(xiàng)（見下表）。

mAP平均精確度，mean of Average Precision的縮寫。

mATE，Average Translation Error,平均平移誤差(ATE) 是二維歐幾里德中心距離(單位為米)。

mASE，Average Scale Error, 平均尺度誤差(ASE) 是1 - IoU, 其中IoU 是角度對(duì)齊后的三維交并比。

mAOE, Average Orientation Error平均角度誤差(AOE) 是預(yù)測(cè)值和真實(shí)值之間最小的偏航角差。(所有的類別角度偏差都在360°度內(nèi), 除了障礙物這個(gè)類別的角度偏差在180° 內(nèi))。

mAVE，Average Velocity Error平均速度誤差(AVE) 是二維速度差的L2 范數(shù)(m/s)。

mAAE，Average Attribute Error,平均屬性錯(cuò)誤(AAE) 被定義為1?acc, 其中acc 為類別分類準(zhǔn)確度。

其中，mAP是最核心指標(biāo)。

資料來源：公開信息整理

mAP意思是平均精確度（averageprecision）的平均（mean），是object detection中模型性能的衡量標(biāo)準(zhǔn)。object detection中，因?yàn)橛形矬w定位框，分類中的accuracy并不適用，因此才提出了object detection獨(dú)有的mAP指標(biāo)，上汽在這個(gè)單項(xiàng)中是第一名。

mAP計(jì)算流程圖，非常復(fù)雜，這里的class就是分類，nuScenes有23個(gè)分類。Ground truth就是人工標(biāo)注的真值，當(dāng)然也可以電腦自動(dòng)標(biāo)注，但人工標(biāo)注是不可或缺的，只是比例多少，一般來說精細(xì)標(biāo)注都是人工標(biāo)注，電腦自動(dòng)標(biāo)注是稀疏標(biāo)注。Prediction預(yù)測(cè)就是深度學(xué)習(xí)模型根據(jù)訓(xùn)練數(shù)據(jù)集給出的答案。要理解平均精確度的概念，要先熟悉幾個(gè)基本概念：

查準(zhǔn)率（Precision）是指在所有預(yù)測(cè)為正例中真正例的比率，也即預(yù)測(cè)的準(zhǔn)確性。

查全率（Recall）是指在所有正例中被正確預(yù)測(cè)的比率，也即預(yù)測(cè)正確的覆蓋率。

真正率為TP，真反率為TN，假正率是FP，假反率為FN。

查準(zhǔn)率是TP/TP+FP，查全率是TP/FP+FN。

單一類別的AP計(jì)算，物體檢測(cè)中的每一個(gè)預(yù)測(cè)結(jié)果包含兩部分：預(yù)測(cè)框（bounding box）和置信概率（PC）。bounding box通常以矩形預(yù)測(cè)框的左上角和右下角的坐標(biāo)表示，即x_min, y_min, x_max, y_max，如下圖。

紅框?yàn)檎嬷狄簿褪莋roundtruth，真值也就是準(zhǔn)確答案；綠框?yàn)樗惴A(yù)測(cè)值，88%是置信度，簡單說就是有88%的可能是狗。

Intersection over Union (IoU)，中文一般叫交并比。交并比IoU衡量的是兩個(gè)區(qū)域的重疊程度，是兩個(gè)區(qū)域重疊部分面積占二者總面積（重疊部分只計(jì)算一次）的比例。如上圖，兩個(gè)矩形框的IoU是交叉面積與合并面積之比。假設(shè)測(cè)試數(shù)據(jù)集中的某一類如“貓”的真值有10個(gè)，此算法預(yù)測(cè)到了5個(gè)，“狗”分類真值也有10個(gè)，此算法也預(yù)測(cè)到了10個(gè)，那么有如下值。

根據(jù)查準(zhǔn)率和查全率，按置信度的不同閾值，我們繪制出一條曲線。

Conf.Thresh.就是置信度閾值的縮寫。根據(jù)表格，可以得到一條查準(zhǔn)率和查全率的曲線。AP是一個(gè)標(biāo)量，可以通過兩種辦法計(jì)算得到。

1）通過矩形累加得到AP

2）通過內(nèi)插10點(diǎn)值計(jì)算AP

K為分類的數(shù)量，即23。

目標(biāo)追蹤榜單如下，只取前五名。

資料來源：公開資料整理

這些打榜的算法主要考慮性能，很少考慮落地性，不過也有考慮到實(shí)際落地的算法，如安波福的純激光雷達(dá)的PointPillars，早在2019年3月就有了，mAP只有0.305，但使用1080ti顯卡就有每秒61.2的幀率，放寬損失函數(shù)最高可達(dá)150Hz，資源消耗最小，也是目前最常見的激光雷達(dá)算法。

零跑EA-LSS算法延遲

零跑的EA-LSS算法模型是基于英偉達(dá)DGX-A100來做的，也就是8張A100顯卡，每秒幀率不到15，顯然是無法落地的。自動(dòng)駕駛的發(fā)展面臨困境，算法越來越復(fù)雜，參數(shù)越來越多，對(duì)算力的需求越來越高，而高算力芯片價(jià)格越來越高。不僅是算力還有存儲(chǔ)帶寬，transformer對(duì)存儲(chǔ)帶寬遠(yuǎn)高于CNN，而高帶寬的HBM價(jià)格是主流的LPDDR4/5的十倍以上。不僅是芯片，計(jì)算系統(tǒng)的其他芯片或部件亦是如此，這導(dǎo)致自動(dòng)駕駛系統(tǒng)成本越來越高，最終可能L4級(jí)計(jì)算系統(tǒng)的價(jià)格超過3萬美元乃至更高。

免責(zé)說明：本文觀點(diǎn)和數(shù)據(jù)僅供參考，和實(shí)際情況可能存在偏差。本文不構(gòu)成投資建議，文中所有觀點(diǎn)、數(shù)據(jù)僅代表筆者立場(chǎng)，不具有任何指導(dǎo)、投資和決策意見。

器件型號(hào)	數(shù)量	器件廠商	器件描述	ECAD模型	參考價(jià)格	更多信息
A3992SLPTR-T	1	Allegro MicroSystems LLC	Stepper Motor Controller, 1.5A, NMOS, PDSO24, 1.2 MM HEIGHT, LEAD FREE, MO-153ADT, TSSOP-24	ECAD模型下載ECAD模型	$1	查看
ADG1419BRMZ-REEL7	1	Analog Devices Inc	2.1 Ω On Resistance, ±15 V/+12 V/±5 V, iCMOS SPDT Switch	ECAD模型下載ECAD模型	$4.03	查看
A3977SLPTR-T	1	Allegro MicroSystems LLC	Stepper Motor Controller, 2.5A, NMOS, PDSO28, TSSOP-28	ECAD模型下載ECAD模型	$5.5	查看

自動(dòng)駕駛算法誰家強(qiáng)？零跑上汽并列第一

推薦器件

相關(guān)推薦

自動(dòng)駕駛算法誰家強(qiáng)？零跑上汽并列第一

推薦器件

相關(guān)推薦

自動(dòng)駕駛算法誰家強(qiáng)？零跑上汽并列第一