AR眼鏡AI用例盤點(diǎn):從單薄的功能一窺廣闊的生命力

0 評論 1511 瀏覽 3 收藏 16 分鐘

AI與各類產(chǎn)品的融合速度正在加快,對于AR或者其他設(shè)備而言,AI功能的加入也成為了一個(gè)不小的賣點(diǎn)。那么,目前AR眼鏡上有哪些主流AI功能?未來的眼鏡終端還將如何發(fā)展?本文做了一定的盤點(diǎn)和分析,一起來看一下。

今年Connect大會(huì)上,扎克伯格拋出了一個(gè)有意思的話題:“讓我特別感興趣的一個(gè)領(lǐng)域是,如何將AI的進(jìn)步與下一代計(jì)算平臺(tái)相結(jié)合。”

伴隨著因ChatGPT爆火而引發(fā)的新一輪熱潮,AI開始加速與千行百業(yè)融合,如今年三月微軟宣布將GPT接入Office辦公套件,谷歌將其AI助手Bard集成到谷歌日歷等應(yīng)用全家桶中等。

同樣,對于AR或者是其他可穿戴式設(shè)備而言,AI也成為了其不可或缺的賣點(diǎn)之一。本文將對目前AR眼鏡上的主流AI功能進(jìn)行盤點(diǎn),一窺技術(shù)發(fā)展趨勢。

以AI驅(qū)動(dòng)的可穿戴式設(shè)備,圖源:Humane

一、Meta AI引入智能眼鏡;ARKnovv A1支持AI三件套

早在GPT爆火之前,VR、AR產(chǎn)品中已經(jīng)出現(xiàn)了很多有關(guān)AI的用例,如結(jié)合了AI算法的手勢識(shí)別、基于AI預(yù)測用戶的全身追蹤等。不過這些功能多停留在用戶無法直接感知的隱性層面。現(xiàn)如今隨著LLM、AIGC等技術(shù)的發(fā)展,AI進(jìn)一步走到了臺(tái)前。

以Meta最近發(fā)布的新一代智能眼鏡產(chǎn)品Ray-Ban Meta為例,它與老款產(chǎn)品比較重要的差異點(diǎn)在于,產(chǎn)品正式實(shí)現(xiàn)了對Meta AI的支持。

Meta官網(wǎng)指出,Meta AI由Llama 2大模型驅(qū)動(dòng),并與微軟Bing搜索引擎達(dá)成了合作,目前已經(jīng)可以通過Instagram、WhatsApp等Meta社交平臺(tái)進(jìn)行訪問。

今年Meta Connect期間,扎克伯格對于Meta AI進(jìn)行了演示(基于其社交APP),Meta AI具備很強(qiáng)的上下文理解能力,可以快速響應(yīng)用戶的各種提問。此外,它還集成了Meta的AI圖像生成工具Emu,可以基于用戶的需求生成相應(yīng)的圖片。

圖源:Meta

除應(yīng)用于自家社交平臺(tái),Meta AI還搭載到了自家的硬件產(chǎn)品Ray-Ban Meta中。由于Ray-Ban Meta并沒有配備屏幕,所以只能以語音的方式輸出,這使得它并不能承擔(dān)太多復(fù)雜的工作?;诎l(fā)布會(huì)演示,Meta AI的作用主要體現(xiàn)在兩方面:一是偏向于功能交互的場景,如通過語音命令拍攝照片,通過語音將圖片視頻分享到Messenger等;二是充當(dāng)一個(gè)類似于ChatGPT式的AI助手的角色,用戶可以與之進(jìn)行閑聊、詢問出行建議等。

除Meta AI外,扎克伯格透露明年將會(huì)為Ray-Ban Meta新增更多AI的能力,如用戶在旅游時(shí)可以通過AI詢問眼前建筑的具體信息;協(xié)助翻譯外語廣告牌上面的內(nèi)容、詢問水龍頭的一些維修建議等。

Ray-Ban Meta AI功能的落地離不開新處理器驍龍AR1 Gen1的應(yīng)用,據(jù)了解,該處理器可實(shí)現(xiàn)眼鏡側(cè)AI,這使得硬件廠商可以在眼鏡中接入系列AI模型。高通官網(wǎng)指出,驍龍AR1 Gen1搭載了第三代Hexagon NPU和用于視覺分析的AR級引擎,可用于增強(qiáng)圖像和音頻質(zhì)量、視覺搜索、實(shí)時(shí)翻譯等。

近日,雷鳥創(chuàng)新官宣了其下一代AR眼鏡新品雷鳥 X2 Lite,產(chǎn)品同樣搭載驍龍AR1 Gen1,具備更強(qiáng)的AI能力也是產(chǎn)品的重要賣點(diǎn)之一,產(chǎn)品可實(shí)現(xiàn)實(shí)時(shí)翻譯、智能出行建議等AI功能。

圖源:Meta

除Ray-Ban Meta以及雷鳥X2 Lite,今年以來發(fā)布的大多數(shù)AR眼鏡產(chǎn)品均配備了AI相關(guān)能力,比較典型的是致敬未知于今年7月發(fā)布的ARKnovv A1。致敬未知?jiǎng)?chuàng)始人吳德周曾表示,“AI和AR的結(jié)合一定是方向,我們希望能夠深度結(jié)合AI,讓AR眼鏡真正能夠成為更有效率、更好玩的工具?!?/p>

產(chǎn)品定位方面,ARKnovv A1與Ray-Ban Meta有較大不同,前者采用分體式設(shè)計(jì),但是補(bǔ)充了雙目Micro-OLED屏幕。此外,前者配備了單目攝像頭,但并不聚焦于拍照攝影,而是用于實(shí)現(xiàn)SLAM等相關(guān)玩法。

在AI功能方面,ARKnovv A1分為了三大塊:基于AI大模型驅(qū)動(dòng)的語音助手、借助攝像頭以及CV實(shí)現(xiàn)的現(xiàn)實(shí)大爆炸(可識(shí)別建筑物、植物、餐廳等)以及基于開源繪圖大模型Stable Diffution打造的AI圖生圖功能。

圖源:致敬未知

近日,李未可CEO茹憶公布了其下一代AR眼鏡李未可Meta Lens S3。茹憶認(rèn)為,當(dāng)下AI在交互計(jì)算平臺(tái)領(lǐng)域的重要性越來越突出,AI交互能力將成為AR眼鏡的核心能力。

產(chǎn)品方面,李未可團(tuán)隊(duì)正在將AI大模型深度整合到AR眼鏡中,AI模型采用“重云輕端 云端一體”的搭建模式,云端構(gòu)建以認(rèn)知、推理、服務(wù)、任務(wù)等模型為基礎(chǔ)的AI大腦,并實(shí)時(shí)響應(yīng)AR終端的用戶需求。

二、除增強(qiáng)現(xiàn)實(shí)、AI如何賦能產(chǎn)品構(gòu)建更前沿的生活方式

可以發(fā)現(xiàn),如何結(jié)合AI為用戶提供更加高頻更加有趣的玩法已經(jīng)變成了如今AR/智能眼鏡產(chǎn)品所探討的重要議題。不過由于產(chǎn)品多聚焦于大眾消費(fèi)市場,使得功能也相對趨同,當(dāng)然也有廠商試圖從中挖掘更加垂直化的用例。

如海外企業(yè)Envision專門面向視障群體開發(fā)了一款眼鏡產(chǎn)品Envision Glasses。該產(chǎn)品基于Google Glass Enterprise 2開發(fā)而來,產(chǎn)品搭載驍龍XR1,配備800萬像素?cái)z像頭。由于產(chǎn)品面向視障群體,它更依賴于AI所支撐的環(huán)境感知以及理解能力,而屏幕或者AR反倒成為了無關(guān)緊要的功能。

以下是Envision Glasses所對外展示的一系列用例:

  • 可以掃描書籍、信件等手寫或印刷文本信息并通過語音的方式向用戶播報(bào),它可識(shí)別超過60種語言;
  • 借助攝像頭進(jìn)行第一視角的通話;
  • 從一堆白色的衣服中挑出紅色的襪子,判斷室內(nèi)的燈是否亮著;
  • 識(shí)別親人朋友等,提醒用戶打招呼。

圖源:Envision

值得一提的是,Envision的前身是一家OCR和物體識(shí)別應(yīng)用開發(fā)商,2017年,企業(yè)上線《Envision AI》APP,該APP同樣瞄準(zhǔn)了視障群體。Envision Glasses需要搭配其手機(jī)APP使用,官網(wǎng)指出眼鏡在正常情況下可提供約5-6小時(shí)的使用時(shí)長。

圖源:Envision

扎克伯格曾表示眼鏡將會(huì)是AI最佳的硬件載體之一,因?yàn)檠坨R能夠見你所見、聽你所聽,很好洞悉用戶的一切。不過,這并不只是當(dāng)前的唯一解。

今年9月底,The Information爆料稱,OpenAI CEO Sam Altman、軟銀集團(tuán)CEO孫正義與前蘋果首席設(shè)計(jì)師Jony Ive進(jìn)行了洽談,三方或?qū)⒊闪⒁患覍W⒂谘邪l(fā)新一代AI硬件的新公司,不過對于AI時(shí)代下的新硬件究竟會(huì)是什么樣子,目前他們?nèi)詻]有達(dá)成共識(shí)。

10月中旬的WSJ公開采訪中,Altman曾表示AI 時(shí)代下計(jì)算機(jī)可以獨(dú)立思考,所以什么樣的硬件都有可能,它或許是新一代手機(jī)、或許是智能音箱、甚至有可能是某種AI驅(qū)動(dòng)的機(jī)器人。不過外界猜測稱,關(guān)于前沿AI硬件最佳實(shí)踐或許正是Altman曾多次投資的科技企業(yè)Humane。

Humane團(tuán)隊(duì)打造了一款A(yù)I投影設(shè)備AI Pin,設(shè)備體積小巧,可像一枚胸針一樣掛于胸前。該產(chǎn)品集成了無喚醒詞的AI助手,除此之外,AI Pin內(nèi)置了一個(gè)投影模組,它可將一些來電聯(lián)系人等簡單的信息投射于手掌中。

據(jù)了解,Ai Pin將會(huì)搭載專用系統(tǒng),甚至有可能會(huì)結(jié)合OpenAI的GPT-4,基于過往的一些案例,用戶可以向設(shè)備發(fā)送撥號(hào)指令、詢問就餐建議、旅行安排、檢測食物卡路里等。此外,Ai Pin的AI助手還將具備一定的上下文聯(lián)系能力。

其他方面,Ai Pin售價(jià)可能會(huì)高達(dá)1000美元,配備高通驍龍芯片,性能可以比肩智能手機(jī)。此前該產(chǎn)品已經(jīng)在9月底的巴黎時(shí)裝秀上有所亮相,并即將于11月9日召開新品發(fā)布會(huì)。更多信息可查看VR陀螺過往文章《iPhone核心團(tuán)隊(duì)成員創(chuàng)業(yè),融資2.3億美元,要做“另類”下一代計(jì)算平臺(tái)》。

圖源:Humane

三、AI持續(xù)進(jìn)化,未來眼鏡終端還將如何發(fā)展?

目前AR眼鏡/智能穿戴仍處于探索期,而AI如何與新一代計(jì)算終端所結(jié)合也同樣如此?;谇懊娴囊恍┯布K端其實(shí)也不難發(fā)現(xiàn),各家廠商對于AI的理解以及側(cè)重點(diǎn)會(huì)有一定差異,但是共識(shí)是AI將會(huì)在新一代計(jì)算設(shè)備革命中發(fā)揮重要用途。

對此,茹憶則提出了一個(gè)簡單明了的觀點(diǎn),如果AR眼鏡是iPhone,那么AI就是iOS,即AI將成為硬件驅(qū)動(dòng)的核心。

從當(dāng)前來看,眼鏡產(chǎn)品上的AI用例仍多集中于基于LLM的語音助手、簡單的識(shí)圖功能等,目前體驗(yàn)仍相對單薄。此外,由于隱私以及設(shè)備續(xù)航所限,設(shè)備的AI能力很多時(shí)候只能處于被動(dòng)觸發(fā)狀態(tài),如只有按下按鈕或者呼出特定語音指令才能有所響應(yīng)(這有點(diǎn)類似于搜索與信息推送的差異)。這種單項(xiàng)互動(dòng)在一定程度上阻礙了AI功能的黏性。

此外,根據(jù)海外平臺(tái)SparkToro調(diào)查數(shù)據(jù),聊天機(jī)器人模型ChatGPT的用戶會(huì)話中,編程協(xié)助以及教育用途最為廣泛,分別達(dá)到了29.1%和11.9%,而聊天互動(dòng)等私人用途占比反而并不算高。未來,如何實(shí)現(xiàn)大語言模型與眼鏡終端更為有機(jī)的結(jié)合也是一個(gè)值得持續(xù)思考的問題。

圖源:SparkToro

其他方面,AR眼鏡的算力薄弱,目前仍以云端側(cè)AI為主。高通今年發(fā)布《混合AI是AI的未來》白皮書里面提到,云端和終端協(xié)同處理的混合AI是AI的未來,這樣才能高效推動(dòng)AI規(guī)?;涞?,并發(fā)揮其最大潛能。隨著端側(cè)AI能力的增強(qiáng),未來設(shè)備可以構(gòu)建更加個(gè)性化以及安全的AI助手,可以在離線狀態(tài)下工作,并且響應(yīng)速度也會(huì)更快。

而AGI(通用人工智能)是AI的下一個(gè)發(fā)展階段,AGI具備更強(qiáng)的感知、推理與學(xué)習(xí)能力,未來當(dāng)AGI引入AR眼鏡之后,它的能力將得到更為廣泛的提升。彼時(shí),AR眼鏡將會(huì)成為一個(gè)更加無感以及智能的設(shè)備。

高通技術(shù)公司產(chǎn)品管理高級副總裁兼AI負(fù)責(zé)人Ziad Asghar采訪中曾提到,在未來5年內(nèi),AI將會(huì)成為一個(gè)更加智能的個(gè)人助理,比如當(dāng)告知設(shè)備會(huì)議要遲到了,它將能自動(dòng)給相關(guān)成員發(fā)送消息。

圖源:高通

關(guān)于這一點(diǎn),或許我們能在發(fā)布的Ai Pin上面看到相關(guān)解法。Humane的一份專利文件中指出設(shè)備可以結(jié)合用戶的體溫、心率等數(shù)據(jù)來估算用戶的感情狀態(tài)以及當(dāng)前環(huán)境的重要性,然后會(huì)選擇是否激活麥克風(fēng)攝像頭等。它有點(diǎn)類似于iPhone的相冊“回憶”功能,但是設(shè)備會(huì)替用戶完成很多隱形的決策工作。

而美國未來學(xué)家Devin Liddell則認(rèn)為,在AI技術(shù)的加持下,AR眼鏡將能獲得遠(yuǎn)超普通人類的超級感官,比如眼鏡可以洞悉用戶的真實(shí)情緒、是否在撒謊等。

比爾蓋茨曾提到,人工智能革命重要程度不亞于手機(jī)和互聯(lián)網(wǎng)的誕生,這是其一生中唯二的革命性技術(shù)進(jìn)步。而未來AR眼鏡/智能眼鏡在AI的加持之下,也將迸發(fā)出我們難以想象得到的創(chuàng)作力以及生命力。

參考資料:

https://mp.weixin.qq.com/s/npZduUT7FYhlqAdp3SsAiQ

https://mp.weixin.qq.com/s/XMzMACpCwjanMpyba73QVQ

作者:萬里

來源公眾號(hào):VR陀螺(ID:vrtuoluo),XR行業(yè)垂直媒體,關(guān)注VR/AR的頭部產(chǎn)業(yè)服務(wù)平臺(tái)。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @VR陀螺 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!