目前,學(xué)術(shù)圈還是用“打榜”來對(duì)自動(dòng)駕駛算法評(píng)分。所謂“打榜”就是在某一數(shù)據(jù)集上利用其訓(xùn)練數(shù)據(jù)集來測(cè)試算法的優(yōu)劣,目前自動(dòng)駕駛?cè)?nèi)最常用的打榜數(shù)據(jù)集是安波福Aptiv旗下的nuScenes。嚴(yán)格意義上的自動(dòng)駕駛算法評(píng)分對(duì)比幾乎是不可能的,單獨(dú)對(duì)比算法不夠公允,此外還必須考慮算法的效率和落地可行性。訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)也會(huì)影響算法的發(fā)揮。同時(shí)由于深度學(xué)習(xí)的不可解釋性,在nuScenes數(shù)據(jù)集上表現(xiàn)好不代表在其他數(shù)據(jù)集也會(huì)表現(xiàn)好,也許會(huì)表現(xiàn)得很差,同樣道理在nuScenes數(shù)據(jù)集上表現(xiàn)不好不代表在其他數(shù)據(jù)集也表現(xiàn)不好。當(dāng)然算力大小無關(guān)算法的準(zhǔn)確度。
nuScenes數(shù)據(jù)集的任務(wù)包括六大類,分別是3D目標(biāo)檢測(cè)detection、目標(biāo)追蹤tracking、目標(biāo)軌跡預(yù)測(cè)prediction、激光雷達(dá)目標(biāo)分割lidar segmentation、全景panoptic、決策planning。其中,3D目標(biāo)檢測(cè)是自動(dòng)駕駛最基礎(chǔ)的任務(wù),全球有近300個(gè)團(tuán)隊(duì)或企業(yè)參加了比試,也是全球自動(dòng)駕駛數(shù)據(jù)集參賽者最多的,足見其權(quán)威性。決策任務(wù)的榜單還沒有公布,因?yàn)榇虬竦娜颂倭恕D繕?biāo)追蹤、目標(biāo)軌跡預(yù)測(cè)參與熱度相對(duì)還比較高,而激光雷達(dá)目標(biāo)分割和全景參與熱度就很低了,不到20家參與。
近期打榜的基本都是中國(guó)企業(yè)或高校,除了中國(guó),其他地區(qū)對(duì)自動(dòng)駕駛?cè)狈εd趣,即便在美國(guó),研究自動(dòng)駕駛的基本都是華人。很少有車企會(huì)參與打榜,早期還有奔馳、博世等企業(yè)參加,奔馳的成績(jī)慘不忍睹,博世還不錯(cuò)。車企不參加打榜的原因很簡(jiǎn)單,成績(jī)好消費(fèi)者也不知情,成績(jī)差的話就會(huì)被競(jìng)爭(zhēng)對(duì)手拿來攻擊,干脆不參與,要參與就是對(duì)自己的能力非常自信,就比如零跑和上汽。
前15名如下:
資料來源:公開信息整理
nuScenes數(shù)據(jù)集的靈感來自開創(chuàng)性的KITTI數(shù)據(jù)集(豐田與德國(guó)KIT于2012年完成)。nuScenes是首個(gè)提供自動(dòng)駕駛汽車整個(gè)傳感器套件(6個(gè)攝像頭、1個(gè)LiDAR、5個(gè)Radar、GPS、IMU)數(shù)據(jù)的大規(guī)模數(shù)據(jù)集。與KITTI相比,nuScenes包含了7倍多的對(duì)象注釋。完整的數(shù)據(jù)集包括大約1.4M相機(jī)圖像(camera images),390k激光雷達(dá)掃描(LiDAR sweeps),1.4M雷達(dá)掃描(Radar sweeps)和1.4M物體邊界框(object
bounding boxes)在40k關(guān)鍵幀。為方便常見的計(jì)算機(jī)視覺任務(wù),如對(duì)象檢測(cè)和跟蹤,在整個(gè)數(shù)據(jù)集上以2Hz的速度用精確的3D包圍框注釋了23個(gè)對(duì)象類;還注釋了對(duì)象級(jí)屬性,如可見性、活動(dòng)和姿勢(shì)。
如果只用相機(jī)也就是純視覺,地平線的Sparse4D包攬第一名和第二名。曠視的FAR3D是第三名,商湯和香港大學(xué)、哈爾濱工業(yè)大學(xué)等聯(lián)合的HOP第四名,豐田排名第五。純視覺的效果比視覺和激光雷達(dá)融合的效果落后不少,但純激光雷達(dá)的效果與視覺和激光雷達(dá)融合后的效果相差甚微。
3D目標(biāo)檢測(cè)的得分共六項(xiàng)(見下表)。
mAP平均精確度,mean of Average Precision的縮寫。
mATE,Average Translation Error,平均平移誤差(ATE) 是二維歐幾里德中心距離(單位為米)。
mASE,Average Scale Error, 平均尺度誤差(ASE) 是1 - IoU, 其中IoU 是角度對(duì)齊后的三維交并比。
mAOE, Average Orientation Error平均角度誤差(AOE) 是預(yù)測(cè)值和真實(shí)值之間最小的偏航角差。(所有的類別角度偏差都在360°度內(nèi), 除了障礙物這個(gè)類別的角度偏差在180° 內(nèi))。
mAVE,Average Velocity Error平均速度誤差(AVE) 是二維速度差的L2 范數(shù)(m/s)。
mAAE,Average Attribute Error,平均屬性錯(cuò)誤(AAE) 被定義為1?acc, 其中acc 為類別分類準(zhǔn)確度。
其中,mAP是最核心指標(biāo)。
資料來源:公開信息整理
mAP意思是平均精確度(averageprecision)的平均(mean),是object detection中模型性能的衡量標(biāo)準(zhǔn)。object detection中,因?yàn)橛形矬w定位框,分類中的accuracy并不適用,因此才提出了object detection獨(dú)有的mAP指標(biāo),上汽在這個(gè)單項(xiàng)中是第一名。
mAP計(jì)算流程圖,非常復(fù)雜,這里的class就是分類,nuScenes有23個(gè)分類。Ground truth就是人工標(biāo)注的真值,當(dāng)然也可以電腦自動(dòng)標(biāo)注,但人工標(biāo)注是不可或缺的,只是比例多少,一般來說精細(xì)標(biāo)注都是人工標(biāo)注,電腦自動(dòng)標(biāo)注是稀疏標(biāo)注。Prediction預(yù)測(cè)就是深度學(xué)習(xí)模型根據(jù)訓(xùn)練數(shù)據(jù)集給出的答案。要理解平均精確度的概念,要先熟悉幾個(gè)基本概念:
查準(zhǔn)率(Precision)是指在所有預(yù)測(cè)為正例中真正例的比率,也即預(yù)測(cè)的準(zhǔn)確性。
查全率(Recall)是指在所有正例中被正確預(yù)測(cè)的比率,也即預(yù)測(cè)正確的覆蓋率。
真正率為TP,真反率為TN,假正率是FP,假反率為FN。
查準(zhǔn)率是TP/TP+FP,查全率是TP/FP+FN。
單一類別的AP計(jì)算,物體檢測(cè)中的每一個(gè)預(yù)測(cè)結(jié)果包含兩部分:預(yù)測(cè)框(bounding box)和置信概率(PC)。bounding box通常以矩形預(yù)測(cè)框的左上角和右下角的坐標(biāo)表示,即x_min, y_min, x_max, y_max,如下圖。
紅框?yàn)檎嬷狄簿褪莋roundtruth,真值也就是準(zhǔn)確答案;綠框?yàn)樗惴A(yù)測(cè)值,88%是置信度,簡(jiǎn)單說就是有88%的可能是狗。
Intersection over Union (IoU),中文一般叫交并比。交并比IoU衡量的是兩個(gè)區(qū)域的重疊程度,是兩個(gè)區(qū)域重疊部分面積占二者總面積(重疊部分只計(jì)算一次)的比例。如上圖,兩個(gè)矩形框的IoU是交叉面積與合并面積之比。假設(shè)測(cè)試數(shù)據(jù)集中的某一類如“貓”的真值有10個(gè),此算法預(yù)測(cè)到了5個(gè),“狗”分類真值也有10個(gè),此算法也預(yù)測(cè)到了10個(gè),那么有如下值。
根據(jù)查準(zhǔn)率和查全率,按置信度的不同閾值,我們繪制出一條曲線。
Conf.Thresh.就是置信度閾值的縮寫。根據(jù)表格,可以得到一條查準(zhǔn)率和查全率的曲線。AP是一個(gè)標(biāo)量,可以通過兩種辦法計(jì)算得到。
1)通過矩形累加得到AP
2)通過內(nèi)插10點(diǎn)值計(jì)算AP
K為分類的數(shù)量,即23。
目標(biāo)追蹤榜單如下,只取前五名。
資料來源:公開資料整理
這些打榜的算法主要考慮性能,很少考慮落地性,不過也有考慮到實(shí)際落地的算法,如安波福的純激光雷達(dá)的PointPillars,早在2019年3月就有了,mAP只有0.305,但使用1080ti顯卡就有每秒61.2的幀率,放寬損失函數(shù)最高可達(dá)150Hz,資源消耗最小,也是目前最常見的激光雷達(dá)算法。
零跑EA-LSS算法延遲
零跑的EA-LSS算法模型是基于英偉達(dá)DGX-A100來做的,也就是8張A100顯卡,每秒幀率不到15,顯然是無法落地的。自動(dòng)駕駛的發(fā)展面臨困境,算法越來越復(fù)雜,參數(shù)越來越多,對(duì)算力的需求越來越高,而高算力芯片價(jià)格越來越高。不僅是算力還有存儲(chǔ)帶寬,transformer對(duì)存儲(chǔ)帶寬遠(yuǎn)高于CNN,而高帶寬的HBM價(jià)格是主流的LPDDR4/5的十倍以上。不僅是芯片,計(jì)算系統(tǒng)的其他芯片或部件亦是如此,這導(dǎo)致自動(dòng)駕駛系統(tǒng)成本越來越高,最終可能L4級(jí)計(jì)算系統(tǒng)的價(jià)格超過3萬美元乃至更高。
免責(zé)說明:本文觀點(diǎn)和數(shù)據(jù)僅供參考,和實(shí)際情況可能存在偏差。本文不構(gòu)成投資建議,文中所有觀點(diǎn)、數(shù)據(jù)僅代表筆者立場(chǎng),不具有任何指導(dǎo)、投資和決策意見。