| 編輯:kkknei
去年 11 月,一家名不見經(jīng)傳的公司 Humane 發(fā)布了一款全新概念的產(chǎn)品——AI Pin,并在此后數(shù)次成為科技圈討論的熱點。包括魅族在年初宣布停止傳統(tǒng)「智能手機」項目 All in AI 的時候,還專門提到了這款新一代 AI 獨立終端的開山之作。AI Pin 到底是什么?如果非要只用一句話介紹,AI Pin 就是一部可以戴在胸口的無屏幕手機。當然,一句話肯定沒辦法講清楚一個全新概念的產(chǎn)品。同樣地,在實際體驗之前也很難給 AI Pin 下一個明確評價和判斷。
AI Pin,但耐人尋味的是,在首批評測解禁后我們發(fā)現(xiàn),幾乎沒有一家媒體認為 AI Pin 是一款值得購買的產(chǎn)品。《連線》雜志吐槽了 AI Pin 實在沒有什么用途,回答結(jié)果也往往讓人失望;The Verge 明確表示 AI Pin 沒有任何值得推薦購買的理由;WSJ 記者 Joanna Stern 吐槽了嚴重的發(fā)熱問題,以及激光投射在戶外的不可用;彭博社記者 Mark Gurman 更直接:體驗了 AI Pin,讓他更相信這些所謂的 AI 設(shè)備不會取代智能手機。但 AI Pin 就這么一無是處嗎?
一款無屏幕的可穿戴「手機」
之前了解過 AI Pin 的讀者應(yīng)該知道,AI Pin 是一款沒有屏幕的獨立穿戴設(shè)備,搭載高通驍龍八核芯片,基于云端 AI 大模型運行,不依賴于手機或者其他個人終端,除了支持觸摸和語音交互,還支持激光投射以及手勢交互。AI Pin 最典型的使用方式用手指放在前面板的觸控區(qū)域,然后通過語音與 AI Pin 進行交互用。
將在上面就能開始對話,就像手機或者智能音箱上接入大模型的 AI 助手一樣,用戶可以問各種問題來獲取所需信息,還支持 50 種語言的實時翻譯,可以將用戶的語言實時翻譯成另一種語言,或是將他人的語言翻譯成用戶的母語。
翻譯對話,不同的是,AI Pin 還能根據(jù)用戶眼前的環(huán)境進行上下文回答,比如識別食材,或者在一個陌生又復雜的環(huán)境中找到需要的信息。受限于設(shè)計和形態(tài),手機就很難像 AI Pin 一樣掛在胸前,很方便就能讓機器「觀察世界,回答一切」。而盡管沒有屏幕,AI Pin 其實還是有一套圖形顯示方案,在需要查看信息的時候,通過內(nèi)置的單色激光將內(nèi)容投射到自己的手掌上進行瀏覽。用戶可以通過一定的手勢進行翻頁、滑動等常用操作,同時 AI Pin 手勢交互的流暢度和靈敏度也比較令人滿意。
MWC 報道團從 AI Pin 的機器視角來看,設(shè)備會識別和初步理解用戶的語音指令,有時候需要通過攝像頭拍攝用戶胸前的畫面,再通過云端的多模態(tài) AI 大模型進行輸入、輸出,最終再傳回 AI Pin 的設(shè)備端進行回應(yīng)。Humane 的兩位創(chuàng)始人前段時間接受彭博社采訪時其實就表示:
對我們來說,(AI Pin 的愿景)就是構(gòu)建一臺上下文計算機。一臺非常個人化的電腦。一臺多模式計算機,意味著它可以使用不同的上下文元素,就像人類一樣。
兩位創(chuàng)始人,簡單來說,人類可以通過視覺、聲音、記憶來處理事務(wù),AI Pin 也配備了攝像頭、聽筒,通過這些元素,讓 AI 擁有多模態(tài)處理能力。AI Pin 將能借此理解用戶,了解用戶的記憶,了解用戶的方位,了解用戶在看什么,了解用戶聽到什么,并在此基礎(chǔ)上回應(yīng)用戶的需求。但愿景歸愿景,至少第一代 AI Pin 在體驗上實在堪憂。
AI 時代的「美麗廢物」
AI Pin 是一個移動使用的可穿戴設(shè)備,這意味著 AI Pin 面對的是極其復雜的網(wǎng)絡(luò)環(huán)境,但同時又是一個嚴重依賴云端提供計算性能的設(shè)備,同時大模型的輸出也需要一定時間,結(jié)果就是:糟糕的延遲表現(xiàn)和反饋體驗。
The Verge 和 Engadget 在評測中都提到了這一點,每次操作等待反饋都要至少等上數(shù)秒,也可能是數(shù)十秒,還可能在漫長的等待之后回復你「處理失敗」的消息。比如詢問一家路邊的餐廳的評價和菜品推薦,大概率會遇到「找不到餐廳」「服務(wù)器沒有響應(yīng)」。
MWC 報道團這種挫敗感相信每一個深入體驗過智能手機或者智能音箱上 AI 語音助手的人,都深有體會。The Verge 甚至調(diào)侃:
經(jīng)過多天的測試,我真正可以依靠 AI Pin 做的唯一一件事就是告訴我時間。
與此同時,AI Pin 大多數(shù)時候的回答可能也很難讓人滿意。《連線》在最開始還驚嘆于 AI Pin 基于攝像頭正確識別物體并進行上下文回答的能力,但在使用一段時間后,很快發(fā)現(xiàn)出現(xiàn)錯誤回答的概率太高了,有些是從視覺識別階段就弄錯了,有些則是在回答階段搞錯。CNET、Engadget 以及其他媒體其實也都提到了類似的問題,簡而言之就是「不可靠」,使用體驗不可靠,回答體驗也不可靠。公允地講,「幻覺」是今天大模型的普遍問題,即便是強如 GPT-4、Claude 3 Opus 也很難大幅改善這個問題,不管是文本還是視覺。再加之語音技術(shù)也做不到逼近完美,在實際的使用環(huán)境中,最好的設(shè)備也會出現(xiàn)沒有識別到語音、錯誤識別語音的情況。
MWC 報道團這些其實都在放大用戶使用 AI Pin 時的挫敗感,進而讓幾乎所有參加首批評測的媒體都想「摘下 AI Pin」。而在官方宣傳最多的翻譯對話場景,AI Pin 倒是總體獲得了大部分媒體的認可。但也有 The Verge 模擬了英語用戶和日語、韓語用戶進行對話的場景,指出了翻譯中信息大量丟失問題。當然,這是 AI 翻譯的問題,很難說是 AI Pin 的問題。
此外,各家也都提到了 AI Pin 極易過熱關(guān)閉的問題。WSJ 記者 Joanna 在戶外甚至只是簡單詢問了幾個問題,AI Pin 就出現(xiàn)了明顯的過熱和警報,CNET、The Verge 都遇到了類似的情況,設(shè)備會主動關(guān)閉等待散熱。而在戶外白天場景下,AI Pin 還有一個問題:單色激光投射很容易「不可見」。WSJ 評測中戶外場景顯然氣溫不高,陽光也不明媚,但也會出現(xiàn)手掌上根本看不見、看不清投射畫面的情況。
WSJ 的吐槽,還有在應(yīng)用上,AI Pin 可以連接谷歌和蘋果賬號同步聯(lián)系人進行接打電話、收發(fā)短信,也可以連接 Tidal(音樂流媒體服務(wù))聽音樂,但也僅此而已了。不過根據(jù) Humane 創(chuàng)始人的說法,更多的服務(wù)和應(yīng)用:即將到來。但即便如此,考慮到 AI Pin 699 美元的售價和每月 24 美元的訂閱費,沒有一家媒體認為這款設(shè)備值得消費者購買。
寫在最后
Humane 的兩位創(chuàng)始人都來自蘋果,分別參與了 iPhone、iPad 的設(shè)計和研發(fā)工作,按照他們的自述,在兩人離開蘋果的一年,其中一位創(chuàng)始人 Chaudhri 就對新一代計算機進行了大量思考,最終認為:
計算的下一次轉(zhuǎn)變將真正由 AI 驅(qū)動。
或許方向是正確的,但 AI Pin 在產(chǎn)品理念和體驗上并沒有受到首批評測媒體的認同。不過也要指出的是,大部分媒體盡管對 AI Pin 的表現(xiàn)一言難盡,但普遍都肯定了 AI Pin 的嘗試,并指出了關(guān)鍵的原因:智能手機這種產(chǎn)品形態(tài)在今天存在很多的問題,不管是屏幕如同黑洞一般吸引著用戶的注意力,還是通知、資訊信息的轟炸,我們始終需要一種比現(xiàn)有智能手機更好的現(xiàn)代解決方案。至于第一代 AI Pin,顯然做得不好。