自動(dòng)駕駛,作為人工智能領(lǐng)域的掌上明珠,是需要經(jīng)過(guò)大量的數(shù)據(jù)學(xué)習(xí)和數(shù)據(jù)訓(xùn)練才能煥發(fā)光彩的。而數(shù)據(jù)的采集成本之高、難度之大,又讓人望而卻步。
近日,華為諾亞方舟實(shí)驗(yàn)室聯(lián)合中山大學(xué)發(fā)布了新一代2D自動(dòng)駕駛數(shù)據(jù)集SODA10M數(shù)據(jù)集。SODA10M擁有數(shù)據(jù)規(guī)模龐大、數(shù)據(jù)多樣性強(qiáng)、泛化能力強(qiáng)三個(gè)特點(diǎn)。華為諾亞方舟實(shí)驗(yàn)室計(jì)劃將基于這個(gè)數(shù)據(jù)集開(kāi)放2D自動(dòng)駕駛挑戰(zhàn)賽,并且會(huì)設(shè)立獎(jiǎng)項(xiàng)和獎(jiǎng)金。
1、規(guī)模10倍于Waymo,業(yè)內(nèi)最大
在“規(guī)模”方面,SODA10M 比現(xiàn)有的BDD100K和Waymo等自動(dòng)駕駛數(shù)據(jù)集大十倍,包含1000萬(wàn)張無(wú)標(biāo)注的道路場(chǎng)景圖像,2萬(wàn)個(gè)帶標(biāo)注的高質(zhì)量2D邊界框,擁有更多可供自動(dòng)駕駛汽車(chē)學(xué)習(xí)的數(shù)據(jù)。
2、多樣性4個(gè)季節(jié)32個(gè)城市
在“多樣性”方面,SODA10M數(shù)據(jù)集中的圖片覆蓋了4個(gè)不同的季節(jié)和32個(gè)城市。
這些照片是在各種條件下拍攝的,晴天雨天、白天黑夜、城市高速…..
1000萬(wàn)張無(wú)標(biāo)注圖片來(lái)自32個(gè)城市,囊括了國(guó)內(nèi)大部分地區(qū),2萬(wàn)張帶標(biāo)注的圖片,直接標(biāo)出了Pedestrian、Cyclist、Car、Truck、Tram、Tricycle這6種主要的人車(chē)場(chǎng)景,以供自動(dòng)駕駛汽車(chē)如何應(yīng)對(duì)各種情況。
據(jù)悉,華為是通過(guò)眾包的方式,把采集任務(wù)分發(fā)給上萬(wàn)名出租車(chē)司機(jī),由司機(jī)拍照或行車(chē)記錄儀完成圖片采集。
3、泛化專(zhuān)注自/半監(jiān)督,用于ICCV2021 SSLAD挑戰(zhàn)賽
在“泛化”方面,SODA10M數(shù)據(jù)集提供了一組卓越的數(shù)據(jù),可用于預(yù)訓(xùn)練自動(dòng)駕駛算法。這是由于數(shù)據(jù)集的多樣性和大小,當(dāng)使用MoCov1時(shí),這導(dǎo)致比Waymo或Cityscapes等其他現(xiàn)有數(shù)據(jù)集有更好的泛化能力。
對(duì)比Waymo自動(dòng)駕駛數(shù)據(jù)集和ImageNet自監(jiān)督算法數(shù)據(jù)集,SODA10M表現(xiàn)優(yōu)異。華為分別從目標(biāo)檢測(cè),BDD100K,Cityscapes語(yǔ)義分割入手,結(jié)果SODA10M的自監(jiān)督訓(xùn)練效果與ImageNet相仿,明顯優(yōu)于Waymo。
研究論文表明,SODA10M 可以作為訓(xùn)練和評(píng)估不同自/半監(jiān)督學(xué)習(xí)方法的有前途的數(shù)據(jù)集。除了標(biāo)準(zhǔn)化評(píng)估之外,這還可以促進(jìn)對(duì)先進(jìn)技術(shù)的探索,以幫助推動(dòng)自動(dòng)駕駛系統(tǒng)向前發(fā)展。
后臺(tái)回復(fù)“華為數(shù)據(jù)集”獲取干貨~
論文:
https://arxiv.org/pdf/2106.11118.pdf
數(shù)據(jù)集:
https://soda-2d.github.io/index.html
項(xiàng)目:
https://sslad2021.github.io/index.html
挑戰(zhàn):
https://sslad2021.github.io/pages/challenge.html