• 正文
    • AI變強,成敗蕭何
    • 語音應(yīng)用駛?cè)肷钏畢^(qū),持續(xù)拷問商業(yè)化能力
    • 開放環(huán)境下,AI推理仍需突破
    • 寫在最后
  • 推薦器件
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

2022:看見AI萬分之一的“不可為”

原創(chuàng)
2022/12/23
1616
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

即將告別五味雜陳的2022年,站在AI產(chǎn)業(yè)的角度去回顧、總結(jié),今年很想做一篇“不一樣”的內(nèi)容。

我們追尋了很多AI的超能力,AI的賦能作用,AI的智能價值……那么,有哪些事情是AI做不了的?可能是因為技術(shù)還需要突破,這是我們未來的創(chuàng)新點;可能是因為應(yīng)用需求還不成熟,需要時間沉淀和產(chǎn)業(yè)界的共同努力;可能是因為成本不夠經(jīng)濟,還需要在商業(yè)落地環(huán)境中進一步打磨;也可能,確實存在一些AI在短期內(nèi)甚至長期來看都無法替代的領(lǐng)域……

只有找到產(chǎn)業(yè)的剛需,找到AI的自驅(qū)力,看到AI應(yīng)用的邊界,明白AI的“有所為”和“有所不為”,我們對于AI的理解,以及對于AI落地的動力和方向才會更為清晰。

在這篇年終特寫中,<與非網(wǎng)>對話幾位AI產(chǎn)業(yè)人士,他們之中有工程師、有企業(yè)高管、有剛參加工作的新人,也有大廠出身抽離AI的資深人士……從另一個角度,他們解讀了AI。

AI變強,成敗蕭何

湯煒偉從事人工智能芯片及相關(guān)產(chǎn)品的開發(fā)落地工作,對于“AI的智能價值,以及AI賦能行業(yè)的價值”,他的理解是,AI賦能行業(yè)——本質(zhì)上是生產(chǎn)力的提升,俗稱“降本增效”,在行業(yè)中提升生產(chǎn)效率,或者節(jié)省成本、釋放人力。

這一輪AI的爆發(fā),如果從2016的AlphaGo算起,也有六七年時間了。這些年里,大量的AI技術(shù)爆發(fā)并得到了應(yīng)用,如互聯(lián)網(wǎng)、安防、消費電子、機器人、智能制造等?!斑@是一次新的生產(chǎn)力革命,在不同領(lǐng)域的降本增效都有著不俗表現(xiàn),也催生了很多商業(yè)模式和創(chuàng)業(yè)公司的出現(xiàn)”,湯煒偉表示。

他列舉了大家都熟悉的例子,如:計算機視覺中的人臉識別、車輛識別技術(shù),這些應(yīng)用達到了大體量的大型底庫下的高識別率——這就相當于用計算機和機器部署了很多雙“慧眼”和后臺對應(yīng)的“記憶力”和“智腦”,替代了警察、保安等人為的繁重工作,并且顯著提高了安全保障效率。

再比如工業(yè)機器視覺,在生產(chǎn)線上以高速攝像頭加上AI智能識別,相比于傳統(tǒng)上人工判斷生產(chǎn)缺陷的方式,帶來了多倍的生產(chǎn)效率提升,并且避免了人為的疲勞帶來的誤判,充分發(fā)揮了機器的高準確率,以及在相對單調(diào)的任務(wù)上不知疲倦的特性等。

此外還有互聯(lián)網(wǎng)推薦,如抖音、快手等短視頻推薦,對于用戶的娛樂體驗帶來了無以倫比的感受。讓用戶沉浸于此的重要原因,就是推薦的內(nèi)容和用戶的心理、愛好等越來越高的匹配度,這背后是推薦算法越來越優(yōu)化的表現(xiàn)。

“然而,任何的單一技術(shù)都存在局限性和應(yīng)用的邊界”,湯煒偉指出。這一輪AI技術(shù)浪潮以深度神經(jīng)網(wǎng)絡(luò)為核心,它師承歷史的聯(lián)接學(xué)派,以設(shè)計不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來表達智能的能力。

那么,在這樣一種發(fā)展背景下,AI如何承上啟下,實現(xiàn)更強的AI?

湯煒偉表示,“產(chǎn)業(yè)界和學(xué)術(shù)界有一種觀點,未來的AI智能技術(shù)也許是綜合了多種技術(shù)的組合,或者是一種全新的技術(shù)的顛覆才能帶來更強的AI。”

回歸到神經(jīng)網(wǎng)絡(luò)發(fā)展的三要素:數(shù)據(jù)、算法、算力,它們既成就了深度學(xué)習(xí)技術(shù),其實也在一定程度上限制了AI的發(fā)展。

首先是數(shù)據(jù),在神經(jīng)網(wǎng)絡(luò)的很多應(yīng)用領(lǐng)域需要海量的數(shù)據(jù)(可能是百萬級甚至千萬級),然而,并不是所有行業(yè)都能輕松獲得這樣量級的數(shù)據(jù)。數(shù)據(jù)要么是難以獲得(如人臉數(shù)據(jù)涉及隱私),要么是標注成本極高(如醫(yī)療影像數(shù)據(jù)的標注具有極高的專業(yè)度,醫(yī)生的專業(yè)時間則意味著極高成本),要么數(shù)據(jù)本身就是小數(shù)據(jù)(如工業(yè)元器件的表面缺陷,沒有海量的數(shù)據(jù))。 這些都給“數(shù)據(jù)”帶來了越來越多的挑戰(zhàn),迫使大家采用數(shù)據(jù)增強、對抗網(wǎng)絡(luò)等方法來解決或者緩解數(shù)據(jù)相關(guān)問題。

其次是算法,深度神經(jīng)網(wǎng)絡(luò)的參數(shù)量越來越大,如GPT-3的1750億參數(shù),這樣海量規(guī)模的算法的訓(xùn)練和收斂、數(shù)據(jù)輸入輸出,以及算法的部署等,都帶來了很大的成本挑戰(zhàn)。這其中包括顯性的算力、存儲、網(wǎng)絡(luò)等成本,也包括工程師的學(xué)習(xí)、熟悉、調(diào)試等大量的學(xué)習(xí)和開發(fā)成本。

第三是算力,雖然在眾多硬件廠商和生態(tài)圈的共同努力下,算力的單位成本在不斷下降。但是,應(yīng)對超大模型的算力成本,仍然是極為高昂的,如GPT-3,訓(xùn)練一次的成本可能高達數(shù)百萬美金。這樣高昂的成本,潛在將眾多資金不足的創(chuàng)業(yè)型公司攔在門檻之外,阻礙了他們應(yīng)用和發(fā)展大模型的能力。

除了三要素,湯煒偉認為還有一點——就是當前的AI系統(tǒng),對于環(huán)境感知的復(fù)雜性、對于智能處理分析和推理的綜合準確性的提升,還有很大的提升空間。

例如環(huán)境感知的復(fù)雜性:在逆光、暗光等光線不佳情況下,難以獲得目標的清晰圖像,自然很難得到神經(jīng)網(wǎng)絡(luò)的正常處理。再比如智能處理分析的完備性,如:智能門鎖貓眼觀察到的外部人員,如何判斷他是想進門,還是經(jīng)過,亦是徘徊或者有破壞等不良意圖,這些都有待于多種傳感器、更聰明的算法和軟件邏輯的組合技術(shù)去進一步突破。

此外,AI系統(tǒng)依賴于“數(shù)據(jù)/經(jīng)驗”,會導(dǎo)致它對沒見過的corner case難以處理?!斑@方面可以舉出很多例子,如掃地機對于纖細型電源線的難以識別,自動駕駛系統(tǒng)對于一些交通意外的難以理解和識別等”,湯煒偉表示,“如果要探討AI的‘不可為’,其實是有時間和空間的限制的,云端AI越來越強大,就像最近很火的chat GPT,但在端側(cè)想實現(xiàn)這種實時性的互動,難度還是很大的。既要看到現(xiàn)在所處的現(xiàn)實,也要從‘不起眼’的突破中找到變強的力量”。

語音應(yīng)用駛?cè)肷钏畢^(qū),持續(xù)拷問商業(yè)化能力

深聰智能董事長周偉達表示,人工智能確實受到了很大的關(guān)注,也取得了一定的成果。對于“AI的不可為”,他從宏觀和微觀兩個角度分享了自己的洞察。

從宏觀角度來看,需要明確AI在當前承擔的角色,它被人類創(chuàng)造并服務(wù)于大眾生活、企業(yè)增效。在這一進化過程中,它雖然不斷進行著升級和完善,但始終無法進行有效的道德判斷和情感思考,相對于真實的人類而言,它依舊有些“高冷”。

從微觀角度來看,從人工智能行業(yè)的落地來看,對“不可為”的這種看法或許來自目前的商業(yè)化落地程度,這也是整個行業(yè)和產(chǎn)業(yè)都在關(guān)注的問題。

深聰智能作為思必馳旗下的語音芯片設(shè)計公司,正面臨著智能語音應(yīng)用駛?cè)肷钏畢^(qū)的局面,一方面需要在場景端進行商業(yè)化拓展,另一方面仍需在技術(shù)領(lǐng)域繼續(xù)投入,來適應(yīng)復(fù)雜場景的需求?!吧虡I(yè)化探索”是智能語音繼續(xù)向前發(fā)展需要解決的一個問題,既需要與傳統(tǒng)產(chǎn)業(yè)融合,又需要解決新興市場剛需和產(chǎn)品方案的配套問題。

不管是傳統(tǒng)還是新興應(yīng)用領(lǐng)域,商業(yè)化的探索并不容易,特別是要在多個行業(yè)同步推進的情況下,基于技術(shù)構(gòu)建系統(tǒng)解決方案的能力、渠道能力、實現(xiàn)精準卡位的能力、持續(xù)盈利的能力……對智能語音的落地都至關(guān)重要。

此外,在芯片與算法融合發(fā)展的趨勢下,如何研發(fā)出更高性能、更低功耗的語音芯片;以及在多模態(tài)融合發(fā)展的態(tài)勢下,如何進一步挖掘市場需求和底層技術(shù)能力,都是智能語音企業(yè)構(gòu)筑競爭壁壘的關(guān)鍵。

目前,深聰智能語音芯片已經(jīng)在黑白電、小家電、車載硬件、會議辦公設(shè)備等多個場景得到了應(yīng)用,不僅為大眾生活提供了語音交互體驗,也為企事業(yè)單位提供了降本增效的服務(wù),應(yīng)用邊界在逐步拓寬。

放眼整個AI領(lǐng)域也是如此,很多企業(yè)都在打通各類資源,協(xié)同上下游產(chǎn)業(yè),都在為AI技術(shù)的落地和應(yīng)用不斷努力。周偉達樂觀認為,現(xiàn)在的“不可為”,在未來一段時間會變?yōu)椤按笥锌蔀椤保@意味著市場空間將會帶來不錯的機遇。同時,作為AI領(lǐng)域的從業(yè)者,作為技術(shù)型企業(yè),通過協(xié)同上下游的產(chǎn)品需求、方案優(yōu)化、實踐部署等環(huán)節(jié),可以加速AI的商業(yè)化落地和應(yīng)用。

開放環(huán)境下,AI推理仍需突破

保險行業(yè)正處在數(shù)字化轉(zhuǎn)型的關(guān)口,嘗試用各種科技智能手段降本增效。車險理賠領(lǐng)域,兼具理賠業(yè)務(wù)本身的流程規(guī)范和定核損環(huán)節(jié)智能化程度有待提升的特點,使得行業(yè)人士認為,可以嘗試用AI解決一些共性問題,例如通過圖像/視頻理賠,盡量減少人工,提高效率。

當前的理賠流程是,理賠人員需要人工確認車輛損失、審核必要證件,所以為了提高效率,行業(yè)嘗試用AI視覺來充當人的眼睛和大腦,一個核心的攻關(guān)場景就是智能定損。

劉金龍是中國人保的一名AI算法工程師,在他看來,“對于開放環(huán)境的事件處理,AI是缺乏原理理解能力的,因此對于無法窮舉的開放場景工作任務(wù),目前還是難以勝任的。”

這背后的邏輯是——人工智能是一定規(guī)則下的智能,而開放環(huán)境打破了特定的規(guī)則,由于開放環(huán)境的數(shù)據(jù)來源不穩(wěn)定,一旦出現(xiàn)特征不足的數(shù)據(jù),就難以智能起來。

以車險理賠場景的一個實際事件為例。當前都是通過圖像實現(xiàn)車輛的定損操作,但圖像是由車主或修理廠人員拍攝的,難免出現(xiàn)不規(guī)范操作,如果圖像拍攝得過于局部,AI就無法判斷損傷所述部件(如下圖)。這時,AI就可能會給出一個很混亂的結(jié)果,無法非常準確地完成任務(wù)。

究其主要原因,還是因為場景非常開放、圖像來源沒有約束性,一旦出現(xiàn)AI未學(xué)習(xí)過(數(shù)據(jù)特征不足)的情形,AI便“不可為”。 劉金龍表示,“AI完成工作的前提是:預(yù)設(shè)規(guī)則,對于無法窮舉所有規(guī)則的事件就會表現(xiàn)出不夠智能的一面,主要還是因為AI對于開放環(huán)境中基于原理的推理能力是不足的?!?/p>

除此之外,劉金龍認為在需要投入感情(情感)的工作方面,還只能作為一種輔助工具來運用。

例如教書育人,需要教師用心、用情去認知每一個學(xué)生,然后根據(jù)不同學(xué)生的特點,用不同的方法引導(dǎo)學(xué)生打開心中疑問;教師也需要以身作則,幫助學(xué)生樹立正確的價值觀、人生觀。同時,教育需要理解事物的原理,剖析其中的真諦,但AI目前是只接受結(jié)果不可解釋過程的一項技術(shù),是無法把事物的本質(zhì)展現(xiàn)給學(xué)生的。而學(xué)生學(xué)習(xí)的目的卻是理解事物的本質(zhì),進而舉一反三、融會貫通。

其次在老年人的陪護方面,需要一個有情感的人去交流、去陪伴,而不是冷冰冰的機器人的簡單對話,或是機械地輔助自理生活。

再比如法律工作,“法律無情,人有情”,在處理法律工作的過程中并不全部是依據(jù)法律條文一一定責的過程,而是法律、事實和情感的交互過程,進而交融出一個合理的結(jié)果。

“以上都不僅僅是經(jīng)驗主義,也不是程序化工作,也沒有辦法數(shù)字化。因此,這些目前均不適合AI來獨立完成”, 劉金龍說道。

寫在最后

我們向往AI更智能,幫助我們“躺平”。但正如本文三位產(chǎn)業(yè)人士所探討,從AI本身的原理和特性、AI落地的商業(yè)化探索,AI與實際場景交融的短板來看,總還是有那么一些“不可為”。

就像萬里星光中,還尚且朦朧的點滴光亮,照亮了AI的真相和方向。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
ATXMEGA128A1-AU 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 100TQFP

ECAD模型

下載ECAD模型
$8.12 查看
STM32F030C8T6TR 1 STMicroelectronics Mainstream Arm Cortex-M0 Value line MCU with 64 Kbytes of Flash memory, 48 MHz CPU

ECAD模型

下載ECAD模型
$3.41 查看
ATXMEGA64D3-MH 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 64QFN
$13.15 查看

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄