華為最新的論文《VisionPAD: A Vision-Centric Pre-training Paradigm for Autonomous Driving》,10位作者中有5位來(lái)自華為諾亞方舟實(shí)驗(yàn)室,其余基本都是香港中文大學(xué),且這其中還有3個(gè)人是在華為諾亞方舟實(shí)驗(yàn)室實(shí)習(xí),可以說(shuō)有8個(gè)人來(lái)自華為諾亞方舟實(shí)驗(yàn)室。VisionPAD提出了一種比較新穎的預(yù)訓(xùn)練方法來(lái)提升OCC性能,將OCC性能關(guān)鍵指標(biāo)mIoU推高到45%,達(dá)到業(yè)內(nèi)第一,學(xué)術(shù)界一般研究超前課題,但華為依然研究BEV+OCC,顯示出傳統(tǒng)算法還有很強(qiáng)的生命力。
Occupancy Network并非特斯拉發(fā)明,最先提出Occupancy Network的是2018年的論文《Occupancy Networks: Learning 3D Reconstruction in Function Space》,主要作者是Tubingen大學(xué)和博世旗下軟件公司ETAS。更早可以追溯至2012年的論文《Indoor Segmentation and Support Inference from RGBD Images》,主要作者是紐約大學(xué)。而最早可以追溯到1986年的論文《A computational approach to edge detection》。Occupancy Network源自語(yǔ)義分割,語(yǔ)義分割需要連續(xù)邊界而不是傳統(tǒng)的Bounding Box(一般會(huì)縮寫(xiě)為BBox),語(yǔ)義分割再加上2D或3D重建,就是Occupancy Network。不過(guò)讓Occupancy Network揚(yáng)名天下的是特斯拉。