2020 年 8 月 7 日,第五屆全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR2020)在深圳正式開(kāi)幕。
CCF-GAIR2020 峰會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,香港中文大學(xué)(深圳)、雷鋒網(wǎng)聯(lián)合承辦,鵬城實(shí)驗(yàn)室、深圳市人工智能與機(jī)器人研究院協(xié)辦。
作為中國(guó)最具影響力和前瞻性的前沿科技活動(dòng)之一,CCF-GAIR 大會(huì)已經(jīng)度過(guò)了四次精彩而又輝煌的歷程。
在大會(huì)第二天的「視覺(jué)智能?城市物聯(lián)」專(zhuān)場(chǎng)上,云天勵(lì)飛首席科學(xué)家王孝宇分析了云天勵(lì)飛在智慧城市中的思路與應(yīng)用。
王孝宇認(rèn)為,在經(jīng)歷了 PC 互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)時(shí)代后,現(xiàn)在人們正在進(jìn)入 AIoT 時(shí)代。在 AIoT 時(shí)代,傳感器將遍布物理世界,人們將擁有無(wú)處不在的連接和智能化應(yīng)用。而 AIoT 時(shí)代到來(lái)的前提,是業(yè)界能提供有效的數(shù)字化技術(shù)。在物理世界的行為,只有經(jīng)過(guò)數(shù)字化后,才能稱(chēng)為“信息”,有了信息,機(jī)器才能更好地描述這個(gè)世界,并對(duì)物理世界作出反應(yīng)。
根據(jù) AI 技術(shù)發(fā)展升級(jí)的路徑,王孝宇將智慧城市分為四大階段。
第一階段是 Sensing(感知),這個(gè)階段的智慧城市能做到的是描述物理社會(huì)的基本事實(shí),比如識(shí)別圖像中的物體是車(chē)輛還是人、車(chē)牌號(hào)是多少、這個(gè)人有什么特征。
第二階段是 CrossAnalysis(交叉分析),這個(gè)階段機(jī)器能夠在識(shí)別基本信息的基礎(chǔ)上,根據(jù)時(shí)間、空間等其他信息進(jìn)行交叉分析,得出更豐富的信息,比如分析出圖片中的人之間的關(guān)系等。
第三階段是 DataMining(數(shù)據(jù)挖掘),這個(gè)階段,機(jī)器能分析出造成事件的深層次原因,甚至預(yù)測(cè)事件的發(fā)生,比如預(yù)測(cè)某路段在某事件段的擁堵情況。
第四階段是 DecisionMaking(決策),即機(jī)器能夠幫助人作出某些決策,比如預(yù)測(cè)到某街區(qū)在某時(shí)間段可能發(fā)生某些事件后,進(jìn)行智能的警員調(diào)度,充分安排有限的警力。
王孝宇還說(shuō)到,盡管智慧城市不同階段能夠?qū)崿F(xiàn)的應(yīng)用不同,但無(wú)論是在哪一階段,都離不開(kāi)算法、算力和大數(shù)據(jù),這也是云天勵(lì)飛從創(chuàng)立之初就一直堅(jiān)持在這三大方面投入大量研發(fā)工作的原因。目前,云天勵(lì)飛有 Arctern 算法平臺(tái)、Moss 芯片平臺(tái)和 Matrix 大數(shù)據(jù)平臺(tái),構(gòu)建了完整的 AI 技術(shù)鏈路,并聚焦公共安全、城市治理、新商業(yè)這三大方向打造產(chǎn)品和解決方案。
最后,王孝宇認(rèn)為,中國(guó)經(jīng)歷過(guò)商貿(mào)造富、互聯(lián)網(wǎng)和房地產(chǎn)造富的時(shí)代,未來(lái)我們很可能迎來(lái)科技造富的時(shí)代,科技將成為新基建中的核心元素。新基建的提出,也將開(kāi)啟中國(guó)新一輪智慧城市建設(shè)的“黃金時(shí)代”,新基建將會(huì)帶來(lái)“新四化”:居民數(shù)字化生活、企業(yè)數(shù)字化經(jīng)營(yíng)、社區(qū)數(shù)字化治理、城市數(shù)字化孿生。
以下是王孝宇大會(huì)現(xiàn)場(chǎng)全部演講內(nèi)容,雷鋒網(wǎng) AI 掘金志作了不改變?cè)獾恼砑熬庉嫞?/p>
王孝宇:非常榮幸能夠跟大家一起分享 AI 在智慧城市中的應(yīng)用,以及我自己的一些思考。
不管是在互聯(lián)網(wǎng)公司,還是在云天勵(lì)飛,我都親眼看到了 AI 技術(shù)在不同場(chǎng)景中的一些現(xiàn)實(shí)的應(yīng)用。我就從我自身經(jīng)歷的角度出發(fā),和大家分享一下當(dāng)前 AI 在智慧城市中的一些應(yīng)用處在什么階段,以及未來(lái)它發(fā)展的趨勢(shì)。
什么是 AI?
四五十年代傳統(tǒng)意義上的 AI 指的是認(rèn)知方面的智能,是通用 AI?,F(xiàn)在的 AI 更具體,是圍繞識(shí)別、生成的技術(shù),包括語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)、機(jī)器人等等。
比較九十年代到現(xiàn)在的 AI 變化,我們可以從多個(gè)維度梳理規(guī)律,其中有一個(gè)維度,是讓機(jī)器更理解人,以及機(jī)器怎么才能獲得和人相關(guān)的更多信息。
PC 互聯(lián)網(wǎng)的時(shí)代,主流工具電腦的位置固定,也只有一個(gè)固定的 IP,電腦中與人連接的有郵箱、瀏覽器記錄以及 ID 信息等,電腦知道背后的人是怎樣,卻不知道背后的人在哪里。因此在 PC 時(shí)代,已經(jīng)有一些社交網(wǎng)絡(luò)公司,因?yàn)楂@取用戶(hù)信息以及建立個(gè)人推薦的時(shí)間長(zhǎng),所以當(dāng)時(shí)的社交公司發(fā)展的周期非常長(zhǎng)。
2010 年或者是更靠后的時(shí)間,進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代,每個(gè)手機(jī)背后都有地理的信息和使用過(guò)的 APP 的信息,人主動(dòng)去 APP 上獲取的信息,APP 也獲取用戶(hù)一定的信息以便更好地理解和服務(wù)用戶(hù)。這也是抖音這類(lèi)公司成功的原因之一。
從獲取人信息的角度,移動(dòng)互聯(lián)網(wǎng)時(shí)代,通過(guò)使用軟件,如美團(tuán)、淘寶等產(chǎn)生交易,APP 得以了解人的習(xí)性,但更多地是人主動(dòng)提供信息給 APP 或廠商。
在經(jīng)歷了 PC 互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)時(shí)代后,現(xiàn)在人們正在進(jìn)入 AIoT 時(shí)代。在 AIoT 時(shí)代,傳感器將遍布物理世界,人們將擁有無(wú)處不在的連接和智能化應(yīng)用。
而 AIoT 時(shí)代到來(lái)的前提,是業(yè)界能提供有效的數(shù)字化技術(shù)。在物理世界的行為,只有經(jīng)過(guò)數(shù)字化后,才能稱(chēng)為“信息”,有了信息,機(jī)器才能更好地描述這個(gè)世界,并對(duì)物理世界作出反應(yīng)。
在 AIoT 時(shí)代,它對(duì)模擬的世界、人的行為都進(jìn)行了數(shù)字化,所以它能夠更好地描述這個(gè)世界。通過(guò)與移動(dòng)互聯(lián)網(wǎng)配合,產(chǎn)生更多的城市治理模式以及商業(yè)模式,這是 AIoT 帶來(lái)的改變。
智慧城市的必要性
云天勵(lì)飛在警務(wù)、教育、交通、商業(yè)、行業(yè)監(jiān)督、社會(huì)治理等方面都有相關(guān)技術(shù)和案例。
除了人臉?biāo)阉?,還有時(shí)序、軌跡的分析,可以與多模態(tài)、車(chē)牌和其他人的屬性關(guān)聯(lián)。視頻的人工智能分析可以應(yīng)用于犯罪聚集;智慧校園的管理上,通過(guò)機(jī)器自動(dòng)化訓(xùn)練方式,對(duì)信息進(jìn)行數(shù)字化和結(jié)構(gòu)化,以此對(duì)未成年人進(jìn)行保護(hù);醫(yī)療行業(yè)上,還可以阻止非法行醫(yī)行為;社會(huì)管理上,解決保障房冒領(lǐng)等。
我分享的這么多應(yīng)用,我覺(jué)得可以分為如下幾個(gè)類(lèi)型,這也是我理解的智慧城市的變遷階段。
第一階段是 Sensing(感知),這個(gè)階段能做到的是描述物理社會(huì)的基本事實(shí)。
比如識(shí)別圖像中的物體是車(chē)輛還是人、車(chē)牌號(hào)是多少、這個(gè)人有什么特征,甚至判斷場(chǎng)景。這個(gè)階段對(duì)視頻和圖片的理解處于初期,但可以發(fā)揮的作用也不少,比如車(chē)牌自動(dòng)識(shí)別,車(chē)費(fèi)自動(dòng)結(jié)算。
?
第二階段是 Cross?Analysis(交叉分析),這個(gè)階段機(jī)器能夠在識(shí)別基本信息的基礎(chǔ)上,根據(jù)時(shí)間、空間等其他信息進(jìn)行交叉分析,得出更豐富的信息。
比如分析圖片中人之間的關(guān)系,一張照片中的兩個(gè)大人和一個(gè)小孩是一個(gè)家庭,并不是說(shuō)所有照片中兩個(gè)大人加一個(gè)小孩都是一個(gè)家庭,這是通過(guò)分析得出。先需要空間上的分析,在同一張照片中每個(gè)人的空間位置,或者視頻中間隔 10 秒鐘拍的照片中人的空間位置,再結(jié)合頻率、動(dòng)作、行為等分析而來(lái)。
這個(gè)階段可能沒(méi)有人提起過(guò),我把它叫做 CrossAnalysis,是 Sensing 到 DataMining 的中間階段,它比基本的事實(shí)又高了一層,在當(dāng)前的智慧城市中還沒(méi)得到應(yīng)用,但我相信很快會(huì)走到這個(gè)階段。
第三階段是 Data?Mining(數(shù)據(jù)挖掘),這個(gè)階段,機(jī)器能分析出造成事件的深層次原因,DataMining 主要呈現(xiàn)分析的結(jié)果,如聚集、犯罪、涉黃,或者預(yù)測(cè)事件的發(fā)生,如預(yù)測(cè)某路段在某時(shí)間段的擁堵情況。
數(shù)據(jù)挖掘在當(dāng)前智慧城市的解決方案中應(yīng)用還不成熟,還沒(méi)有達(dá)到想要的精度,但我們最終會(huì)邁向這一步。
第四階段是 Decision?Making(決策),即機(jī)器能夠幫助人作出某些決策,比如預(yù)測(cè)到某街區(qū)在某時(shí)間段可能發(fā)生某些事件后,進(jìn)行智能的警員調(diào)度,充分安排有限的警力。
?
智慧城市建設(shè)的核心 AI 技術(shù):算法、算力和大數(shù)據(jù)
不論在哪個(gè)階段,AI 的核心都是算法、算力和大數(shù)據(jù),我這里說(shuō)的大數(shù)據(jù)并不是通常意義上說(shuō)的需要訓(xùn)練算法的、標(biāo)注的大數(shù)據(jù),我們說(shuō)的大數(shù)據(jù)就是 DataMining。
云天勵(lì)飛所有的研發(fā)都聚焦在 AI 三大平臺(tái)上:
Arctern 算法平臺(tái),由云天勵(lì)飛多次獲得國(guó)際視覺(jué)大賽冠軍團(tuán)隊(duì)打造。沒(méi)有算法就無(wú)法結(jié)構(gòu)化信息,它是從 0 到 1 的基礎(chǔ)平臺(tái),有了算法平臺(tái),可以部署到各個(gè)地方。
Moss 芯片平臺(tái),是人工智能芯片的國(guó)家隊(duì),取名 Moss,代表它無(wú)處不在。我們目前是第一代基于電子的傳統(tǒng)芯片,未來(lái),將出現(xiàn)功耗低的光芯片,直接安裝于傳感器,通過(guò)光信號(hào)的自動(dòng)化處理,進(jìn)行智能分析。
Matrix 大數(shù)據(jù)平臺(tái),是國(guó)家超算中心采用的 AI 平臺(tái),在這個(gè)平臺(tái)上,我們能做更深層次的分析。
云天勵(lì)飛基于三大平臺(tái),聚焦三大產(chǎn)業(yè)方向。
一是公共安全,基于人像分析能力,構(gòu)建城市安全盾牌,聚焦智慧警務(wù)、機(jī)場(chǎng)立體防護(hù)、行人闖紅燈取證、靜態(tài)人像融合等領(lǐng)域。二是城市治理,AI 觸角從城市大尺度空間向最后一公里滲透,包括智慧醫(yī)院、智慧社區(qū)、智慧校園、智慧樓宇等。三是新商業(yè),與綜合商場(chǎng)、連鎖門(mén)店合作。
我們相信未來(lái)在生活的每個(gè)角落,未來(lái)無(wú)處不在的智能分析會(huì)給我們帶來(lái)更多效率的提升,當(dāng)然其中很多隱私問(wèn)題亟待我們解決,但是我一直堅(jiān)信技術(shù)是中立的,以后會(huì)有越來(lái)越多的新的規(guī)范,讓我們的技術(shù)往好的方向發(fā)展。
新基建將開(kāi)啟新一輪智慧城市建設(shè)的“黃金時(shí)代”
中國(guó)經(jīng)歷過(guò)商貿(mào)造富、互聯(lián)網(wǎng)和房地產(chǎn)造富的時(shí)代,未來(lái)我們很可能迎來(lái)科技造富的時(shí)代,科技將成為新基建中的核心元素。
新基建的提出,也將開(kāi)啟中國(guó)新一輪智慧城市建設(shè)的“黃金時(shí)代”,新基建將會(huì)帶來(lái)“新四化”:居民數(shù)字化生活、企業(yè)數(shù)字化經(jīng)營(yíng)、社區(qū)數(shù)字化治理、城市數(shù)字化孿生。
居民數(shù)字化生活,比如掃碼乘車(chē)、智能政務(wù)服務(wù)、互聯(lián)網(wǎng)服務(wù)。
企業(yè)數(shù)字化,之前只有大公司或者跨國(guó)公司才能承擔(dān)企業(yè)數(shù)字化經(jīng)營(yíng)的服務(wù),未來(lái)可能每個(gè)小企業(yè)都能實(shí)現(xiàn)數(shù)字化經(jīng)營(yíng)。我一直認(rèn)為科技的發(fā)展是讓一些以前只有非富即貴的人才能享受到的東西實(shí)現(xiàn)便民化,這是科技化發(fā)展的一個(gè)很顯著的路徑。
社區(qū)數(shù)字化治理,通過(guò) AI 的方式,實(shí)現(xiàn)社區(qū)高效管理,保障社區(qū)安全,這次疫情給中國(guó)社區(qū)管理數(shù)字化提供了很好的契機(jī)。
最后才能達(dá)到城市數(shù)字化孿生。
如何實(shí)現(xiàn)新”四化“,我們認(rèn)為在技術(shù)層面,搭建“IoT+5G+AI”架構(gòu),分別提供采集、傳輸和分析技術(shù);方法層面,采用“1+1+N”的 AI 城市綜合服務(wù)體,需要一張基于 IoT 智能感知的網(wǎng)絡(luò),無(wú)處不在地對(duì)這個(gè)物理世界的信息進(jìn)行數(shù)字化和結(jié)構(gòu)化,一個(gè)基于 OS 的城市大腦,通過(guò) 5G 傳輸?shù)胶蠖?AI 城市大腦,AI 城市大腦通過(guò)最基本的事實(shí)分析和 DataMining 做出判斷和決策,以及 N 個(gè)基于 AI 的城市應(yīng)用場(chǎng)景。
這是云天勵(lì)飛的愿景,我們認(rèn)為未來(lái)幾十年內(nèi),在科技界,結(jié)構(gòu)化物理世界,打造數(shù)字孿生城市是主要方向。