大模型有能力打穿智能音箱/硬件的市場壁壘么?
智能音箱很重要,以AI為主打的多模態(tài)產(chǎn)品都與它有一定聯(lián)系。下邊是筆者講述關于智能音箱的相關內(nèi)容,大家可以來看一看。
突然看到小度科技景鯤和朱凱華要離職創(chuàng)業(yè)的消息,一下子就覺得很有必要再說下智能音箱。智能音箱當年紛繁亂戰(zhàn),百度其實是其中一只非常重要的力量,而代表人物無疑就是景鯤。本來以為大模型可以讓這款產(chǎn)品迎來自己新的想象空間,沒想到卻看到這么個消息。這實在是為上一波的智能音箱徹底的畫上了個句號。
一、智能音箱:產(chǎn)品路線圖上的“兵家必爭之地”
為什么說智能音箱是產(chǎn)品路線圖上的兵家必爭之地呢?因為以AI為主打的多模態(tài)產(chǎn)品怎么都繞不過它。
就像喀什之所以重要就在于它是兩條西去路線的交匯處一樣,大山就留了這么個口子,你想如果要像玄奘那樣西行就怎么也繞不過這地兒。
智能音箱是智能產(chǎn)品的一個檻,它成了很多同種類產(chǎn)品比如故事機、鏡子等就成了,它不成AI大模型的力量其實就在純軟的空間里憋著,我們設想的多模態(tài)產(chǎn)品等就止于想象。在從Agent到多模態(tài),大模型想要什么?中我畫了一張產(chǎn)品的圖,無意間也正好把智能音箱放到了這么一個中間的位置上。
這產(chǎn)品非常的承上啟下。承上承的就是純軟的Siri類助理,啟下啟的的就是各種機器人(兵家必爭之地的一個隱含意義就是這地兒本身不一定有那么大價值但丟了會很難受)。
二、那為什么智能音箱會在這么個位子呢?
原因也不復雜。
但在回答這問題之前需要區(qū)分兩類產(chǎn)品:
- AI為主打特征的產(chǎn)品。
- AI是輔助特征的產(chǎn)品。
遙控器上也可以放語音交互功能,但那是輔助特征。智能音箱則不是。智能音箱如果AI不出彩,這產(chǎn)品就立不住。對于很多產(chǎn)品AI是作料,像遙控器那樣輔助其它特征,智能音箱這個產(chǎn)品上AI是主菜,別的功能特征輔助AI。
這是很少的幾款真正靠AI特征驅(qū)動并且達到一定量級的產(chǎn)品(掃地機器人其實也是)。
對于AI主打的產(chǎn)品要么你處理純粹的數(shù)字世界的工作,否則要想走出來和現(xiàn)實世界有交互則需要通過聲光電熱力磁各個維度的不同傳感器,感知現(xiàn)實世界并進行決策等,基于此提供新的體驗和功能。在其中智能音箱主要改變交互,感知和接入現(xiàn)實的程度最淺,也就意味著難度其實最低。如果這么說不好理解,可以類比導購機器人,顯然的導購機器人需要對現(xiàn)實進行更深層次的感知。
最容易的產(chǎn)品立不立得住基本表示大模型等的新能力是不是能夠走出數(shù)字空間,走出想象,獲得一條商業(yè)上真的能夠通往現(xiàn)實世界的路。
當然智能音箱可以涵蓋帶屏不帶屏的版本。順道說一句電視不管加多少語音特征都不是AI主打的,電視主要還是依賴自己的內(nèi)容分發(fā)通路,核心支撐是它的屏。依賴屏和依賴智能特征很容易混雜,但其實不是一個事(這個區(qū)分和綜合后面會落在AR眼鏡上)。
如果智能音箱能成立,具身機器人就肯定可以獲得一個比較堅實的基礎,在它上面進行生長,否則就得變成必須靠自己移動的特征、更深層的感知來獲得應用場景上的支撐,這顯然更困難。這就是為什么前面說智能音箱可以啟下。
當然反過來也成立,智能音箱都做不好,卻指望一個更難的能成立,這不虛妄么。
三、過去做的怎么樣呢?
我覺得有70~80分。
智能音箱的事業(yè)其實是一鍋燒成了90度的水,或者說打穿80%市場壁壘的事。
為什么這么說呢?
因為如果你說它不成立,它每年也有3~4千萬的銷量;如果你說它成立呢,它核心的產(chǎn)品支撐其實回歸到了音箱的特征,只在極小的一些功能,比如天氣、鬧鐘上保留了一點智能的特色。當然它還可以負責鏈接,比如控制窗簾,但這事也就屬于能用,卻并不出彩。
每天的活躍很難超過10次,并且領域很窄。
這導致了一個不上不下的局面。
所有當初的設想中和入口價值有關的部分都很難成立。沒太看重的,比如變成了單獨的一個消費電子品類,變成一個新的類似電視的產(chǎn)品,它卻逐漸成立了。從這個角度看,藍牙音箱到智能音箱更像是黑白電視到彩色電視的升級,而不是計算機變成電腦了。
從公司運轉(zhuǎn)的角度看,精細化運營是可以打平的,但很可能價值還不如掃地機器人,因為單價太低;從戰(zhàn)略意義上看,對大公司而言它就變的不怎么有戰(zhàn)略意義了。
這就更讓智能音箱不單在技術上還在市場上成為一個試金石。
在有用戶基礎的前提下,如果大模型的新勢能還是撐不起它來。那在現(xiàn)實空間大模型就只能輔助做些邊緣型的產(chǎn)品比如故事機等(當然這不妨礙純粹數(shù)字空間里面Copilot這類產(chǎn)品成立)一旦跨過了這個檻,就不單是音箱,甚至可能會重構手機,讓機器人真的產(chǎn)品化。這就可以打開一個近乎無限的空間。
那實際情況更可能是什么樣呢?這次能打穿這個應用壁壘,邁過這個坎么。
四、不在現(xiàn)在時候,還需要時間
至少是下一波3~5年后的事了。不是眼前的事。
各種智能硬件所代表的硬應用本質(zhì)都和感知反饋所能擴充的應用空間有關。這么說有點抽象,我們可以類比下智能音箱和Siri類助手。Siri類助手是真的助手,更像是一個軟的超級應用,實現(xiàn)現(xiàn)在微信借助小程序所能實現(xiàn)的一切功能,雖然也可以推個消息,但本質(zhì)上是被動被用戶使用,不感知環(huán)境的。
但智能音箱則不一樣,它可以有耳朵聽你喊沒喊它,甚至聽是不是有異常的聲音;它可以有眼睛捕捉手勢,甚至看到是不是有老人摔倒然后報警。后者這類對環(huán)境感知所支撐的的價值越大,硬應用價值越大,越會成為一個單獨的品類,否則裝APP就夠了,買個音箱干啥!所以此前的GPT4對智能音箱類產(chǎn)品本質(zhì)幫助不大,內(nèi)容生成等更匹配生產(chǎn)力工具(電腦、平板)。
最近的多模態(tài)確實在支撐這個空間。讓感知、決策、反饋的鏈條可以更連貫。
而剛出來多模態(tài)版本顯然有很多路要走,但更關鍵的還不是這個,而是這個新品類要想成立,第一關鍵固然是依賴的技術要素成熟不成熟,但更關鍵是則是一種基于現(xiàn)實的想象力。在早期階段甚至都不需要更便宜,而是需要真的好用的新品類,否則和需求和市場之間的通路是堵著的。
挑動這個的難度恐怕不低于創(chuàng)造iPhone。因為這根本不是現(xiàn)在這條路繼續(xù)走下去,走快點就能走到目的地的工作。對于智能音箱而言這需要再定義這個品類,打造出除了音樂等內(nèi)容輸出外更有價值的功能點。這會很像Pokemon Go扮演的角色。如果整不出來,單純是裸的模型其實基本沒幫助,也拯救不了智能音箱。
這么說估計還是抽象,我們舉幾個發(fā)散的、不一定行的例子:
- 比如做英語陪練,那智能音箱上的陪練要能聽的遠,看的見,要擬人真的像一個英語老師,否則就還是手機陰影下的產(chǎn)品。類似的可以有很多擬人的產(chǎn)品,它可以成為一個能講故事、回答問題的啟蒙老師么?
- 比如,在真的足夠豐富的元宇宙里,它如果代表了你和元宇宙的連接,代表你的分身,那它就有獨立的價值。
這是真的麻煩。希望有人能肩負起這個使命,否則就只能等C2C。而假如C2C,再假如open AI這種公司帶頭來做,并且真的做出來了,那對于硬件產(chǎn)品再經(jīng)過市場檢驗的兩三年,怎么也是三年后的事了。
五、回到大分類
在《AI個體戶的崛起:普通人“屁胡”的機會、模式和風險》中,我們做過一個這樣的總結:
長尾曲線最頭部是通用大模型以及配套的生態(tài),次一級是現(xiàn)有應用的人工智能化和垂直領域的系統(tǒng)型超級應用,尾部會甩開大量人工智能的新應用。這個尾巴有可能比過去應用商店里的應用甩得長。
現(xiàn)在看來大模型自身,系統(tǒng)型超級應用,長尾新應用中,現(xiàn)在看中間這節(jié)是最不通暢的。多模態(tài)應用比如智能音箱則正好是其中一個比較大的分支。
這其實很要命的,就像人的腰很關鍵一樣,如果這節(jié)起不來,那回卷會把一切基礎設施上比如英偉達、數(shù)據(jù)等的泡沫擠的干干凈凈(我有個朋友經(jīng)常關注基礎設施,但其實基礎設施后續(xù)走勢的關鍵可能并不在大模型,而在這里)。
六、小結
順道一說,近來經(jīng)??吹胶芏嗳撕?0年前一樣,又去追論文,追那個科學家的什么觀點,試圖弄清楚模型到底什么技術源流,參數(shù)是什么含義等。這些東西要知道,但實在離應用太遠,科研上越熱的離的越遠,所以更應該被折疊,知道一個相對確定的結果就可以了。從應用看技術,其實遠比比從技術看應用更關鍵。不管是Mac,Windows,還是iPhone其實都是從應用看技術的結果,而非相反。
專欄作家
琢磨事,微信公眾號:琢磨事,人人都是產(chǎn)品經(jīng)理專欄作家。聲智科技副總裁。著有《終極復制:人工智能將如何推動社會巨變》、《完美軟件開發(fā):方法與邏輯》、《互聯(lián)網(wǎng)+時代的7個引爆點》等書。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
手機上的AI,也是輔助