• 正文
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

技術(shù)轉(zhuǎn)型新思路 | AI方向教師資格證考培課程

2022/04/06
179
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

智能汽車機器人的第一形態(tài),對應(yīng)的智能座艙也引領(lǐng)了機器人時代人機交互發(fā)展的新方向。歷史上,每一次交互方式的改變,都重塑了智能設(shè)備的產(chǎn)業(yè)格局。正如DOS轉(zhuǎn)向Windows時代帶來的產(chǎn)業(yè)巨變一樣,人機自然交互打開了一道通向新產(chǎn)業(yè)的大門。

人機自然交互將改變我們對待智能汽車、泛機器人和人工智能的態(tài)度。人類最重要的發(fā)明是創(chuàng)造了語言體系,用于人與人的交互,帶來人類文明;今天,人機自然交互可能是下一個基石性發(fā)明,其與機器的自主決策強結(jié)合,將帶來機器文明,重塑人與機器的關(guān)系,對我們的社會工作方式及生活方式等方面將產(chǎn)生深遠的影響。

關(guān)鍵結(jié)論
1.未來最重要的人機交互趨勢是機器從被動響應(yīng)走向主動交互,從人適應(yīng)機器到機器不斷地適應(yīng)人,終極目標是讓機器擬人化,圖靈測試是衡量標準。

2.人機共駕階段,人機交互能力必須跟自動駕駛能力相匹配,否則會帶來嚴重的安全問題。智能駕駛和智能座艙的跨域融合是發(fā)展方向。

3.未來,實體屏幕和觸控將不再是座艙交互的中心,取而代之的是自然交互+AR-HUD。

4.語音、手勢和眼球跟蹤是自然交互的三板斧,傳感器算力和算法是物質(zhì)基礎(chǔ)。

5.當前的座艙以娛樂域為主導(dǎo),但未來座艙內(nèi)娛樂域和安全域(人機交互和自動駕駛)的定位會調(diào)過來,安全域會成為主控制域。

6.智能座艙人機交互是中國智能汽車公司品牌向上的重要突破口。

人與機器的交互方式發(fā)展趨勢是什么?
座艙的人機交互未來將走向何方?這個問題的答案,可能需要從智能設(shè)備的發(fā)展歷史中去尋找。

計算機行業(yè)是人機交互技術(shù)發(fā)展的起源。實際上,人機交互一開始不叫HMI,而是HCI,即Human–Computer Interaction。PC的發(fā)展史廣為人知,下圖是一個簡單的發(fā)展階段劃分:

計算機人機交互發(fā)展歷程

最開始是DOS系統(tǒng)加上鍵盤,命令行界面的操作需要非常高的專業(yè)技能,只有少數(shù)專業(yè)人員才能使用。鼠標與Windows操作系統(tǒng)的出現(xiàn)改變了一切,讓PC用戶呈爆炸性增長。接下來,觸控成為更簡單直接的操作方式,出現(xiàn)了Surface這樣的平板電腦。而微軟小娜則代表了最新的交互方式,我們可以用語音這種更加自然的方式與機器交互。

PC和手機的發(fā)展史折射出機器與人交互方式的發(fā)展脈絡(luò),那就是從復(fù)雜走向簡單;從抽象操作走向自然交互。未來最重要的人機交互趨勢是機器從被動響應(yīng)走向主動交互。
順著這樣一個趨勢的延長線去看,人機交互的終極目標,就是讓機器擬人化,可以說:人機交互的發(fā)展歷史,是從人適應(yīng)機器到機器不斷地適應(yīng)人的發(fā)展史。

智能座艙的發(fā)展也經(jīng)歷了類似的過程:

智能座艙的人機交互發(fā)展與計算機有頗多相似之處

多模交互是下一代人機交互方式的理想模型,什么是多模交互?簡單說,就是利用手勢、眼球跟蹤、語音等方式來進行交互。這里的模態(tài)類似于人的“感官”,多模態(tài)即是將多種感官進行融合,對應(yīng)人視覺、聽覺、觸覺、嗅覺、味覺五種感官。

但多模交互的命名太過技術(shù)化,我更愿意將其稱之為:自然交互。

例如手勢,可以說是原生的“鼠標”,不同的手勢能夠表達豐富的語義。

典型的手勢語義以及對應(yīng)的實現(xiàn)方式

自然交互實現(xiàn)方式是什么?
智能汽車本質(zhì)上是載人機器人,機器人最重要的兩項能力是自主決策能力和人機交互能力,缺乏其中任何一項,就無法有效地為人類服務(wù)。因此打造智能的人機交互能力是其必選項。

如何衡量人機交互的智能化程度呢?我的一個思考是使用圖靈測試,即機器能否在交互行為的表現(xiàn)上和人無法區(qū)分。

如何實現(xiàn)自然交互呢?傳感器、算力和算法缺一不可。下圖做了一個直觀的展示:

座艙內(nèi)會融合越來越多的傳感器,一方面會使座艙內(nèi)算力需求不斷飆升,座艙里的AI算力需求將上升到30 TOPS以上,甚至百TOPS級別的水平。另一方面也提供了更好的感知能力支撐。

座艙傳感器在數(shù)量和種類上都在迅速提升

AI計算能實現(xiàn)人臉、表情、手勢、語音等多信息的感知,從而實現(xiàn)更加智能的人機交互。座艙人機交互的計算必須依賴邊緣計算,而不是云計算來實現(xiàn)。因為三點:可靠性、實時性和隱私保護。

個人隱私保護可能是我們這一代人在AI時代面臨的最大挑戰(zhàn)之一,座艙內(nèi)的私密空間,隱私保護問題更加突出。今天的語音識別,絕大部分仍然是在云端進行的,其中的聲紋等生物信息可以輕易暴露個人身份。通過在車端進行邊緣AI計算,可以將視頻、語音等個人生物信息去除,轉(zhuǎn)化為語義信息,再上傳到云端,可以有效保護車內(nèi)個人數(shù)據(jù)隱私。

自動駕駛時代,交互智能必須跟駕駛智能相匹配
在可以預(yù)見的未來,人機共駕都會是長期存在的狀態(tài),座艙內(nèi)的人機交互是人了解自動駕駛能力的第一界面。

當前智能汽車技術(shù)存在進化不均衡的挑戰(zhàn),人機交互能力落后于自動駕駛能力的發(fā)展,導(dǎo)致自動駕駛事故頻發(fā),影響了自動駕駛的普及。

人機共駕的特點是人在駕駛回路中(Human In the Loop),因此,人機交互能力必須跟自動駕駛能力相匹配,否則帶來嚴重的預(yù)期功能安全問題,幾乎所有的自動駕駛致命事故都與此有關(guān)。即使不發(fā)生事故,對自動駕駛狀態(tài)的不了解也會讓人產(chǎn)生嚴重的恐慌和焦慮。

例如,自動駕駛系統(tǒng)在實際駕駛工況中,經(jīng)常出現(xiàn)“鬼剎車”的情況。如果人機交互界面能夠顯示自動駕駛的感知結(jié)果,司機就可能會明白系統(tǒng)誤判是由于把路上的一個易拉罐識別成了一輛車導(dǎo)致的。

為什么特斯拉把越來越多的自動駕駛感知結(jié)果展示出來,背后的出發(fā)點就是這一原因。隨著自動駕駛的能力越來越強,用戶將越來越關(guān)注自動駕駛系統(tǒng)在虛擬3D環(huán)境中呈現(xiàn)的過程和狀態(tài)。

人機交互與自動駕駛相輔相成,其具體作用如下圖所示:

?

人機交互與自動駕駛相輔相成

例如,未來更為人性化的泊車應(yīng)該是人車共泊的,包括人對車的接管和車對人的接管,比如車遇到困難路況,可能會說我不太有把握,請求接管。再比如人遲遲停不進去,AI算法推薦是否開啟自動泊車。

這種艙泊一體的方案能提升智能座艙交互和泊車的整體體驗,還能大幅節(jié)省硬件成本:通過分時復(fù)用AI芯片的資源,可以同時滿足座艙感知與APA泊車感知的需求,從而為行業(yè)提供高性價比方案,也可讓智能化下探到更多中低端車型。在國內(nèi),地平線和映馳科技合作,正在推進這一方案開發(fā)。

當前,智能座艙的交互方式主要還是手機安卓生態(tài)的延伸,主要由實體屏幕來支撐。今天屏幕越變越大,甚至達到60寸,這實際上是用低優(yōu)先級的功能占據(jù)了高優(yōu)先級功能的空間,還帶來額外的信息干擾,容易讓人分心,影響駕駛安全。

實體屏幕在未來依然會存在,但我有一個判斷,未來,實體屏幕和觸控將不再是座艙交互的中心,取而代之的是自然交互+AR-HUD,下面我們做進一步分析。
第一個原因:面向自動駕駛的人機交互屬于溫飽問題,是剛需,屬于安全域,有最高優(yōu)先級;面向音樂、游戲和舒適性的人機交互是小康需求,屬于娛樂域,在實現(xiàn)了前一階段任務(wù)后才能有足夠的施展空間。

下圖對兩個域的功能做了簡要的分析總結(jié)。

座艙內(nèi)娛樂域和安全域的任務(wù)劃分

因此,未來座艙內(nèi)娛樂域和安全域(人機交互和自動駕駛)的定位會調(diào)過來,安全域會成為主控制域。

第二個原因:自然交互方式+AR-HUD的交互界面更加安全,例如通過語音和手勢交流,可以避免駕駛員視線偏移,從而提升駕駛安全。而座艙的大屏是無法做到這一點的,相比之下,AR-HUD可以做到在顯示自動駕駛感知信息的同時避免了這個問題。

第三個原因:自然交互方式是隱形的、簡約的、更加情感化的交互方式,不會過多地占用車內(nèi)寶貴的物理空間,但卻可以做到隨時陪伴在身邊,給予駕駛員及乘客更多的信任感、安全感。

綜合以上分析,未來智能駕駛和智能座艙的跨域融合是較為確定的發(fā)展方向,最終誕生的就是車載中央計算平臺。

當前發(fā)展階段、前沿實踐以及挑戰(zhàn)
目前,座艙的語音識別基本已經(jīng)普及,語音識別主流廠商主要使用端到端算法,在理想實驗環(huán)境下語音識別準確率可高達98%以上。

DMS正在急速普及,預(yù)測至2030年裝備車內(nèi)攝像頭的車型占比將超過50%。

DMS普及勢頭迅猛

下一步將是語音+手勢+眼球跟蹤+AR-HUD交互界面的組合,這是對應(yīng)于L3+級別自動駕駛的智能交互方式。業(yè)內(nèi)領(lǐng)先的車企已經(jīng)開始布局,如下圖所示。

人機自然交互成為車企的競爭熱點

中國自主品牌在這一塊的實踐基本上跟國外領(lǐng)先品牌是并駕齊驅(qū)的,從迭代速度上看還要更快。2020年,長安推出UNI-T車型, 包含多項主動服務(wù)。比如:如果你正在接聽電話,系統(tǒng)會自動降低多媒體音量;再比如,當車機中控屏處于熄屏狀態(tài)時,注視屏幕一秒即可喚醒屏幕。該方案搭載了地平線的征程2芯片,支持通過語音、動作姿態(tài)、面部表情等指令的交互。

理想中的自然交互目標是從用戶體驗出發(fā),需要提供穩(wěn)定、流暢、可預(yù)期的交互體驗。但理想再豐滿,也得從骨感的現(xiàn)實起步,當前挑戰(zhàn)依舊眾多。

例如,當前自然交互的誤識別情況依然嚴峻,全工況、全天候的可靠性和準確率還不夠。比如手勢識別,也許你不經(jīng)意間動一下手勢,就會被誤識別為一個命令動作,這只是無數(shù)種誤識別情況之一,在移動狀態(tài)下,光照、震動、遮擋等等都是巨大的工程挑戰(zhàn)。自然交互的流暢度也是亟待解決的問題,這需要更高性能的傳感器、更強大的算力和高效算法來逐漸改善。而同時自然語言理解(NLP)和意圖理解依然處于早期階段,還需要算法理論創(chuàng)新。

人機自然交互是機器人時代的基石性發(fā)明

總結(jié)
在當下激烈的行業(yè)競爭中,智能座艙已經(jīng)成為整車廠實現(xiàn)功能差異化的關(guān)鍵一招,座艙人機交互與人的溝通習(xí)慣、語言文化等密切相關(guān),因此必須是高度本地化的,智能座艙人機交互是中國智能汽車公司品牌向上的重要突破口,更是中國智能汽車技術(shù)引領(lǐng)全球技術(shù)潮流的突破口。

智能座艙產(chǎn)業(yè)鏈將持續(xù)延伸,會有更多玩家進入到智能汽車這個大生態(tài)中,智能汽車玩家也會跨界進入更多的機器人領(lǐng)域,未來智能座艙生態(tài)圈發(fā)展主題將圍繞“生態(tài)協(xié)同”與“跨界延伸”展開。這場科技革命將產(chǎn)生顛覆性影響,不僅將開啟一個全新的產(chǎn)業(yè)生態(tài),更對我們的社會工作方式及生活方式等方面產(chǎn)生深遠的影響。

作者:李星宇簡介

李星宇,地平線生態(tài)發(fā)展與戰(zhàn)略規(guī)劃副總裁,聚焦自動駕駛、人工智能芯片以及邊緣計算等領(lǐng)域,負責地平線戰(zhàn)略規(guī)劃與生態(tài)建設(shè)工作。
李星宇先生是自動駕駛與汽車芯片行業(yè)資深專家,擁有18年半導(dǎo)體行業(yè)經(jīng)驗。加入地平線前,曾任恩智浦(飛思卡爾)應(yīng)用處理器汽車業(yè)務(wù)高級市場經(jīng)理,及士蘭微電子安全技術(shù)專家。
?

相關(guān)推薦