Mobileye在CES 2022上宣布,目前已采集了200PB的數(shù)據(jù),這意味著Mobileye擁有了一個虛擬的駕駛數(shù)據(jù)寶庫。這些數(shù)據(jù)配合Mobileye一流的計算機視覺技術(shù)和強大的自然語言理解(NLU)模型使用,即使是罕見條件和場景下的“長尾”事件,仍可以在幾秒鐘內(nèi)輸出數(shù)千個結(jié)果。而這有助于自動駕駛汽車和一流的計算機視覺系統(tǒng)處理邊緣情況,從而讓自動駕駛汽車實現(xiàn)超高的平均故障間隔時間(MTBF)。
Mobileye總裁兼首席執(zhí)行官Amnon Shashua教授表示:“數(shù)據(jù)和處理數(shù)據(jù)的基礎(chǔ)設(shè)施是為自動駕駛技術(shù)實現(xiàn)帶來了復(fù)雜性。Mobileye花了25年時間一直在收集并分析我們認為是業(yè)界領(lǐng)先的,包含了現(xiàn)實環(huán)境和模擬駕駛體驗的數(shù)據(jù)庫,通過實現(xiàn)強大的自動駕駛解決方案脫穎而出,這些解決方案能夠?qū)崿F(xiàn)超高的平均故障間隔時間?!?br /> Mobileye擁有全球公認龐大的汽車數(shù)據(jù)集,包含了過去25年中超過200 PB的真實環(huán)境駕駛視頻素材,共1600萬個1分鐘視頻片段。
Mobileye數(shù)據(jù)集擁有超過200PB的真實環(huán)境駕駛視頻素材
對自動駕駛所需的強大計算機視覺引擎而言,大規(guī)模數(shù)據(jù)標注是核心。Mobileye擁有豐富且相關(guān)的數(shù)據(jù)集,由2500多名專業(yè)標注人員手動標注或自動標注。該計算引擎依靠云服務(wù)器中的50萬個峰值CPU內(nèi)核,每月處理5000萬個數(shù)據(jù)集——相當于每月處理由50萬小時的駕駛素材所生成的100 PB數(shù)據(jù)。
數(shù)據(jù)的價值在于能夠被解讀的同時并投入使用,這需要對自然語言的深入理解以及先進的計算機視覺算法,而這一直是Mobileye的優(yōu)勢。
每個自動駕駛公司都面臨“長尾”問題,即自動駕駛汽車會遇到從未見過或經(jīng)歷過的情況。這些長尾問題包含了龐大的數(shù)據(jù)集,但許多企業(yè)不具備高效理解這些數(shù)據(jù)集所需的工具。Mobileye先進的計算機視覺技術(shù)與強大的自然語言理解模型配合使用,能在幾秒鐘內(nèi)查詢長尾數(shù)據(jù)集并返回數(shù)千個結(jié)果。隨后,Mobileye可以使用這些結(jié)果來訓練計算機視覺系統(tǒng)并使其更加強大。Mobileye的方法大大加快了開發(fā)周期。
Mobileye團隊使用內(nèi)部搜索引擎數(shù)據(jù)庫,其中包含數(shù)百萬張圖片、視頻片段和場景。其內(nèi)容覆蓋面極廣,從“被雪覆蓋的拖拉機”一直到“夕陽下的交通信號燈”,所有這些都由 Mobileye采集并饋入其算法(參見樣本圖像)。
Mobileye數(shù)據(jù)集包含數(shù)百萬張圖片、視頻片段和場景
通過業(yè)內(nèi)最高質(zhì)量的數(shù)據(jù)和專業(yè)人才,Mobileye的駕駛政策可以確保做出合理、明智的決策,這種方法消除了人工智能決策的不確定性,并在統(tǒng)計上實現(xiàn)了超高的平均故障間隔時間。同時,數(shù)據(jù)集加快了開發(fā)過程,讓自動駕駛技術(shù)“挽救生命”的承諾可以更快地成為現(xiàn)實。