AI+搜索|關(guān)于搜索的想象,和目前估值最高的生成式搜索引擎 Perplexity

0 評(píng)論 6724 瀏覽 27 收藏 33 分鐘

AI大模型與搜索場(chǎng)景有著天然的契合度,而 Perplexity 幾乎是最早推出的生成式搜索引擎,或者叫做回答引擎,Perplexity AI?成立一年,估值可達(dá) 5 億美金。那么,Perplexity究竟有哪些過(guò)人之處?一起來(lái)看看本文的拆解。

技術(shù)的變革會(huì)影響信息的收集與分發(fā)機(jī)制。印刷術(shù)發(fā)明后人們使用索引和目錄來(lái)查找圖書(shū),互聯(lián)網(wǎng)出現(xiàn)后人們使用關(guān)鍵詞來(lái)查找鏈接,Google 創(chuàng)始人拉里·佩奇發(fā)明的 PageRank 算法、以及意圖識(shí)別等算法策略優(yōu)化,旨在通過(guò)以算法為中心的任務(wù)式分發(fā)機(jī)制幫助用戶找到更好的網(wǎng)頁(yè)鏈接。

AI 讓信息搜索不再是關(guān)鍵詞和鏈接的單向匹配,而是一種直觀而精確的雙向?qū)υ?。Perplexity AI 最早將這一愿景變?yōu)楝F(xiàn)實(shí),成立一年估值達(dá) 5 億美金。它是一個(gè)由前 Open AI 員工創(chuàng)建的會(huì)話型搜索引擎,讓人窺見(jiàn)到一個(gè)搜索不僅僅是關(guān)于發(fā)現(xiàn),也是關(guān)于理解的未來(lái)。本文從技術(shù)變革下搜索的發(fā)展歷史出發(fā),深入解讀目前 AI+搜索頭部產(chǎn)品 Perplexity AI,看搜索與搜索引擎的邊界。

思考:

我們嘗試基于文章內(nèi)容,提出更多發(fā)散性的推演和深思,歡迎交流。

產(chǎn)品優(yōu)先:Perplexity 在初期使用了大量 API 來(lái)構(gòu)建產(chǎn)品,團(tuán)隊(duì)專注產(chǎn)品層面的優(yōu)化,通過(guò)深刻的產(chǎn)品洞察來(lái)彌補(bǔ)模型能力不足導(dǎo)致的潛在問(wèn)題,再去自研基礎(chǔ)設(shè)施來(lái)降低成本。

信息互動(dòng):在盡可能減少幻覺(jué)的條件下,用 LLM 輔助和外部信息互動(dòng),Perplexity 是一個(gè)很好的例子。這種形式不局限于搜索引擎,任何需要和外部信息互動(dòng)的場(chǎng)景,都可以期待 LLM 的重構(gòu)。

搜索的邊界:小紅書(shū)、公眾號(hào)等平臺(tái)對(duì)內(nèi)容的遷移和封閉限制了全局搜索引擎的發(fā)展。然而搜索本身對(duì)大量信息進(jìn)行搜集、過(guò)濾、總結(jié)、整合等工作曾經(jīng)依賴搜索主體,如今 AI 能夠?qū)⑺阉鬟^(guò)程可互動(dòng)式外化。搜索引擎成為一種新的內(nèi)容平臺(tái)。

AI Native 產(chǎn)品分析——Perplexity AI

1.產(chǎn)品:Perplexity AI

2. 產(chǎn)品上線時(shí)間:2022 年 12 月

3. 創(chuàng)始人:

  • Aravind Srinivas:CEO,曾在 UCB 就讀博士主攻強(qiáng)化學(xué)習(xí)和圖像識(shí)別。博士期間,曾在 OpenAI、DeepMind 和 Google 實(shí)習(xí),21 年畢業(yè)后加入 OpenAI 研究語(yǔ)言模型和擴(kuò)散模型
  • Denis Yarats:CTO,曾在 Quora 擔(dān)任機(jī)器學(xué)習(xí)工程師,在 Meta AI 研究院研究強(qiáng)化學(xué)習(xí)、最優(yōu)化控制和機(jī)器人
  • Andy Konwinski:聯(lián)合創(chuàng)始人,也是 Databricks 的聯(lián)合創(chuàng)始人
  • Johnny Ho:首席戰(zhàn)略官,此前是量化交易員

4. 產(chǎn)品簡(jiǎn)介:

Perplexity 是用于信息發(fā)現(xiàn)和滿足好奇心的瑞士軍刀。它通過(guò)回答問(wèn)題的方式,幫助用戶總結(jié)內(nèi)容、探索新主題并激發(fā)創(chuàng)造力。

5. 發(fā)展歷史

  • 2022 年 8 月,Srinivas 離開(kāi) OpenAI 后創(chuàng)立了 Perplexity
  • 2022 年 9 月,獲得 310 萬(wàn)美元種子輪融資
  • 2022 年 11 月,ChatGPT 上線
  • 2022 年 12 月,Perplexity AI 上線
  • 2023 年 3 月,Perplexity 在 A 輪融資中籌集了 2560 萬(wàn)美元,估值 1.5 億美元
  • 2023 年 10 月,推出訂閱制服務(wù)后 ARR 達(dá)到 300 萬(wàn)美元,完成由 IVP 領(lǐng)投的新一輪融資,估值達(dá)到 5 億美元

一、搜索的演變

從搜索的歷程發(fā)展可以追溯到人們對(duì)信息的需求和查找分發(fā)方式的演變。

搜索的概念最早可以追溯到印刷術(shù)的出現(xiàn),當(dāng)時(shí)人們開(kāi)始使用目錄和索引來(lái)幫助他們查找書(shū)籍和文獻(xiàn)。1990 年代中期,Yahoo! 等早期搜索引擎開(kāi)始出現(xiàn),它們使用關(guān)鍵詞匹配的方式幫助用戶查找網(wǎng)頁(yè),但搜索結(jié)果并不總是準(zhǔn)確或完整。

1998 年谷歌成立,創(chuàng)始人之一拉里·佩奇發(fā)明。PageRank 算法,通過(guò)評(píng)估網(wǎng)頁(yè)之間的鏈接數(shù)量和質(zhì)量,將給定網(wǎng)頁(yè)的權(quán)重和重要性進(jìn)行排名。此后,網(wǎng)站所有者需要了解 PageRank 算法以及其他搜索引擎的排序因素,以便優(yōu)化網(wǎng)站以提高其在搜索引擎中的排名。

搜索引擎優(yōu)化(SEO)專家開(kāi)始研究關(guān)鍵詞的選擇和使用、網(wǎng)站內(nèi)容的優(yōu)化、外部鏈接的建設(shè)、用戶體驗(yàn)的改善等策略,以適應(yīng)谷歌的發(fā)展。他們努力通過(guò)技術(shù)手段和優(yōu)化方法,使網(wǎng)站在搜索引擎結(jié)果頁(yè)面(SERP)中獲得更高的可見(jiàn)性和排名。

參考我們之前的文章頂級(jí)風(fēng)投Greylock:會(huì)最先被AI重塑的高潛市場(chǎng),Greylock 提出 AI 使得原來(lái)以算法為中心的信息分發(fā)網(wǎng)絡(luò)變成去中心化式人與人的雙向網(wǎng)絡(luò)。于搜索而言,搜索有望不再是單邊的信息查詢和SEO策略優(yōu)化,而成為一種雙邊的信息交互。

二、Perplexity AI 是什么?

Perplexity 幾乎是最早推出的生成式搜索引擎,或者叫做回答引擎。借用大模型的力量,用戶可以直接提問(wèn),Perplexity 會(huì)直接從各種篩選過(guò)的來(lái)源進(jìn)行總結(jié),提供準(zhǔn)確、直接的答案,同時(shí)提供來(lái)源參考。

當(dāng) ChatGPT 剛推出時(shí),它憑借出色的自然語(yǔ)言理解能力和生成豐富回答的能力,曾一度讓人們認(rèn)為生成式 AI 可能會(huì)取代傳統(tǒng)搜索引擎。

然而,隨著用戶體驗(yàn)中的幻覺(jué)現(xiàn)象、無(wú)法聯(lián)網(wǎng)和知識(shí)更新滯后等問(wèn)題逐漸顯現(xiàn),人們開(kāi)始回歸現(xiàn)實(shí),轉(zhuǎn)向由大型模型增強(qiáng)的搜索引擎,例如 Perplexity 和 Bing Chat。這些“回答引擎”利用 RAG(Retrieval Augmented Generation)技術(shù),對(duì)搜索引擎的結(jié)果進(jìn)行處理,以減少誤導(dǎo)信息并提高信息的及時(shí)性。除了 Perplexity 和 Bing Chat,其他一些曾企圖挑戰(zhàn) Google 搜索引擎霸主地位的平臺(tái),如 You.com 和 Neeva,也轉(zhuǎn)向了 AI 增強(qiáng)的答案生成模式。

與傳統(tǒng)搜索引擎相比,回答引擎主要在以下幾個(gè)方面進(jìn)行了優(yōu)化:理解用戶問(wèn)題的能力、總結(jié)搜索結(jié)果的能力、保留搜索結(jié)果索引的能力,以及擴(kuò)展用戶問(wèn)題的能力。這些優(yōu)化旨在降低用戶使用門檻,節(jié)省用戶在不同網(wǎng)頁(yè)上搜索和瀏覽的時(shí)間,確保搜索結(jié)果的可靠性,同時(shí)為用戶提供深入挖掘問(wèn)題的能力。

正是因?yàn)檫@些特點(diǎn),當(dāng) Bing Chat 于今年 2 月正式推出時(shí),微軟 CEO 納德拉對(duì)其寄予了厚望,將其視為開(kāi)啟搜索新時(shí)代的重要標(biāo)志。他認(rèn)為這是對(duì)谷歌在搜索引擎市場(chǎng)長(zhǎng)達(dá) 20 年的主導(dǎo)地位的前所未有的挑戰(zhàn)。然而,到了 10 月的谷歌反壟斷案時(shí),納德拉表現(xiàn)出了轉(zhuǎn)變,坦誠(chéng) Bing Chat 尚有許多待解決的問(wèn)題,且在市場(chǎng)份額競(jìng)爭(zhēng)中未達(dá)預(yù)期效果。全球范圍內(nèi),搜索引擎市場(chǎng)的格局依舊穩(wěn)定。

盡管在訪問(wèn)量上 Perplexity 仍遠(yuǎn)不及主流搜索引擎,而且也有許多批評(píng)聲音將其視為僅是表面包裝,但自推出以來(lái),Perplexity 一直保持穩(wěn)定增長(zhǎng),在同類產(chǎn)品中保持最高訪問(wèn)時(shí)間,其表現(xiàn)甚至超過(guò)了有多年 AI 結(jié)合搜索引擎經(jīng)驗(yàn)的 You.com。

在 a16z 發(fā)布的月訪問(wèn)量前 50 的 GenAI 產(chǎn)品中,PerplexityAI 排名第十。從 3 月到 10 月的半年時(shí)間內(nèi),Perplexity AI 每天處理的搜索請(qǐng)求量增長(zhǎng)了 6~7 倍,目前每天要處理數(shù)百萬(wàn)個(gè)搜索請(qǐng)求。

即使在其他大型模型紛紛引入聯(lián)網(wǎng)能力后,Perplexity 仍保持良好發(fā)展勢(shì)頭。因此,本文將結(jié)合實(shí)際使用體驗(yàn),探討許多人眼中的 GPT “套殼”產(chǎn)品 Perplexity 的獨(dú)特之處。

三、Perplexity 如何脫穎而出?

Perplexity的三大優(yōu)點(diǎn):迭代速度快、效果佳以及功能創(chuàng)新。

1. 迭代速度快,每周一個(gè)小更新

如下圖所示,自 Perplexity 推出以來(lái),其重要的更新和里程碑事件一目了然。在不到一年的時(shí)間里,Perplexity 已經(jīng)實(shí)現(xiàn)了多次關(guān)鍵的版本迭代。特別是在更新頻繁的時(shí)期,幾乎每周都會(huì)推出新的功能,這些更新主要集中在產(chǎn)品功能層面,直到今年 10 月,Perplexity 才低調(diào)推出了旨在降低運(yùn)行成本的大型模型。

分析推特中 Perplexity 篩選出涉及到的版本更新相關(guān)內(nèi)容詳情和數(shù)據(jù),包括各個(gè)版本的發(fā)布日期和相關(guān)推文的點(diǎn)贊次數(shù),可以看出點(diǎn)贊最多的是去年年底推出的 Twitter 搜索引擎。團(tuán)隊(duì)對(duì)搜索具有敏銳的產(chǎn)品洞察,在 GPT-3.5 推出后的半個(gè)月就上線了推特基于 SQL 的搜索分析引擎。點(diǎn)贊數(shù)其次的是新模型推出類動(dòng)態(tài),而 Perplexity 團(tuán)隊(duì)更為重視和投入的產(chǎn)品更新迭代類內(nèi)容關(guān)注較少。

可以推測(cè),目前大眾對(duì) AI+搜索類產(chǎn)品的認(rèn)知,還處在同類產(chǎn)品的嘗新,尚未進(jìn)入對(duì)產(chǎn)品功能的深入體驗(yàn)或形成顯著的用戶粘性。

2. 功能創(chuàng)新,補(bǔ)足回答引擎的短板

「Devil in the details.」,Perplexity 的卓越搜索體驗(yàn)得益于其眾多創(chuàng)新功能,尤其是 Source Edit(信源編輯)、Focus Search(專注模式)和 Perplexity Copilot。

Perplexity 并不總是都表現(xiàn)良好。例如,在查詢“Twitter 的 CEO 是誰(shuí)”時(shí),盡管同類產(chǎn)品均能正確回答 Linda Yaccarino,Perplexity 卻有時(shí)會(huì)答錯(cuò)。這一錯(cuò)誤源于其引用了未及時(shí)更新的維基百科條目。針對(duì)此類錯(cuò)誤,Source Edit 功能可提供有效解決方案。

Source Edit 允許用戶編輯參考信源并重新搜索。目前,這一功能僅支持刪除而非添加信源,有效減少無(wú)關(guān)信源對(duì)結(jié)果的干擾,通過(guò)人工的方式,對(duì)潛在的不穩(wěn)定性進(jìn)行修正??梢钥吹剑懦税e(cuò)誤信息的維基百科后,Perplexity 能夠給出正確答案。

此外,用戶可通過(guò) Focus Search 功能,在開(kāi)始新搜索前限定搜索范圍,提升搜索效果。該功能在學(xué)術(shù)搜索、數(shù)學(xué)計(jì)算、YouTube 視頻和 Reddit 論壇搜索等方面進(jìn)行了特別優(yōu)化。特別是 YouTube 視頻搜索,其引用可直接鏈接到視頻中相關(guān)內(nèi)容的準(zhǔn)確時(shí)間點(diǎn)。

Perplexity Copilot 則增強(qiáng)了搜索結(jié)果的準(zhǔn)確性和可信度。作為用戶的搜索助手,Copilot 提供更細(xì)致、深入和個(gè)性化的回答。

對(duì)于同樣的問(wèn)題,通常 Copilot Search 參考的信源更多、回答更長(zhǎng)、展示方式更結(jié)構(gòu)化,同時(shí)在搜索過(guò)程中,Copilot 會(huì)對(duì)用戶的問(wèn)題含義進(jìn)行延伸,在一次用戶的搜索中,實(shí)則進(jìn)行了多次對(duì)于不同關(guān)鍵詞的搜索。如下圖所示,使用 Copilot 搜索同樣的關(guān)鍵詞,Copilot 會(huì)自動(dòng)對(duì)用戶的意圖進(jìn)行延伸,使用不同的關(guān)鍵詞進(jìn)行搜索并最終總結(jié)。

個(gè)性化的搜索。Perplexity Copilot 不僅深入理解用戶意圖,還根據(jù)用戶的個(gè)人情況提供定制化內(nèi)容。

例如,詢問(wèn)餐廳推薦時(shí),會(huì)自動(dòng)要求用戶補(bǔ)充必要的信息,如餐廳所在的地點(diǎn);同時(shí),Copilot 會(huì)根據(jù)用戶的 AI Profile 所需補(bǔ)充信息,如下圖(右)可以看見(jiàn),在作者在 AI Profile 中提前設(shè)置好了自己所在城市后,Perplexity Copilot 便不再要求用戶補(bǔ)充地址信息;最后,當(dāng) Copilot 要求用戶補(bǔ)充信息時(shí),會(huì)采用更加 LLM Native 的交互方式,會(huì)根據(jù)要求的補(bǔ)充信息類型,Copilot 自主選擇最合適的交互方式來(lái)讓用戶輸入,如下圖(右)就自動(dòng)生成了一組復(fù)選框。

Perplexity Copilot 使用了 Fine-tuned GPT-3.5 而非 GPT-4。根據(jù)測(cè)試,F(xiàn)ine-tuned GPT-3.5 在大多數(shù)情況下(69%)能提供與 GPT-4 同等甚至更好的性能,甚至在少數(shù)問(wèn)題上,能夠提供比 GPT-4 更好的表現(xiàn)。

Perplexity 的愿景不僅是成為更好的搜索引擎,而是打造一個(gè)全面的知識(shí)中心,助力用戶輕松學(xué)習(xí)新知。為此,Perplexity 自開(kāi)發(fā)之初便專注于優(yōu)化其引用信源和發(fā)散性問(wèn)題處理能力。

9 月份,Perplexity 圍繞此愿景推出了“合集(Collections)”功能。在 Perplexity 中,每次查詢對(duì)話被視作一個(gè)線程(Thread),而合集則是線程的容器,功能類似于收藏夾。合集不僅能整理線程,還能圍繞主題拓展新問(wèn)題,邀請(qǐng)協(xié)作者共同構(gòu)建知識(shí)社區(qū)。

3. 效果優(yōu)秀,快速、準(zhǔn)確、可靠

Perplexity 在多個(gè)方面展現(xiàn)出卓越的性能,尤其是在內(nèi)容的可靠性、信源的豐富性、響應(yīng)速度的快捷性以及內(nèi)容的穩(wěn)定性方面。

首先,其內(nèi)容的可靠性和信源的豐富性尤為顯著。以搜索 OpenAI 最新的 Dev Day 更新為例,在 Bard、Perplexity、GPT4 和 You.com 中進(jìn)行搜索,Perplexity 不論是用中文還是英文,均展現(xiàn)了最為全面的信源引用和最佳的搜索結(jié)果。GPT4 雖然依賴正確的關(guān)鍵詞,但其結(jié)果質(zhì)量緊隨其后,而 Bard 和 You.com 在中英文兩種搜索中表現(xiàn)并不全面。

此外,Perplexity 在結(jié)果的穩(wěn)定性和生成速度上同樣表現(xiàn)出色。與其他競(jìng)爭(zhēng)對(duì)手相比,Perplexity 在反復(fù)查詢相同問(wèn)題時(shí),基本能夠基于相同信源提供一致的答案,有效降低了大模型的不確定性。同時(shí),其生成答案的速度在所有同類產(chǎn)品中也是最快的。

除了從用戶體驗(yàn)角度定性分析,也有學(xué)者嘗試對(duì)回答引擎的效果進(jìn)行定量評(píng)估。今年 4 月,Stanford 的 Nelson F. Liu 發(fā)表了論文《Evaluating Verifiability in Generative Search Engines》,對(duì) Bing Chat、Perplexity、YouChat 和 Neeva 等幾大搜索引擎進(jìn)行了評(píng)估。這篇論文從四個(gè)維度來(lái)測(cè)試:文本流暢度、感知有效性、引文回憶率和引文精確度。綜合來(lái)看,Perplexity 在這項(xiàng)評(píng)估中表現(xiàn)最為出色。

四、Perplexity AI 的體驗(yàn)不足

基于上述種種優(yōu)點(diǎn),有的用戶認(rèn)為 Perplexity AI 已經(jīng)完全可以代替?zhèn)鹘y(tǒng)的搜索引擎;而也有用戶則給出了完全相反的意見(jiàn),認(rèn)為其信源不足、結(jié)果價(jià)值低,難以替代傳統(tǒng)搜索引擎。

評(píng)價(jià)上的落差可能是源自于對(duì)回答引擎的高期望和使用習(xí)慣的不適應(yīng)。

1. 期待值高

論文 Evaluating Verifiability in Generative Search Engines 的作者 Nelson F. Liu 認(rèn)為,整體來(lái)說(shuō)這類回答引擎遠(yuǎn)遠(yuǎn)沒(méi)有到達(dá)他們預(yù)期的表現(xiàn)。現(xiàn)存的回答引擎,生成的結(jié)果通常都很流暢并且「看起來(lái)」很有信息量(informative),但是在引文回憶率和引文精確度上都表現(xiàn)不佳 —— 僅有 51% 生成的陳述得到了引用內(nèi)容的充分支持,而只有 74.5% 的引用能正確支持生成的結(jié)果。

論文作者還發(fā)現(xiàn),生成的內(nèi)容在引用準(zhǔn)確度上和有效性上,存在明顯的負(fù)相關(guān)。這很有可能是為了降低幻覺(jué)的一種代價(jià),體現(xiàn)在,生成的結(jié)果常常是直接復(fù)制引用的內(nèi)容,或者的引用內(nèi)容的改寫(Paraphrase),當(dāng)信源實(shí)際上和用戶的問(wèn)題并不相關(guān)時(shí),這種問(wèn)題就會(huì)非常明顯。

舉例來(lái)說(shuō),當(dāng)用戶提問(wèn)“引導(dǎo)社會(huì)進(jìn)化的動(dòng)力是合作還是競(jìng)爭(zhēng)?”時(shí),回答引擎可能會(huì)引用動(dòng)物進(jìn)化中關(guān)于合作和競(jìng)爭(zhēng)的內(nèi)容。同時(shí),作者認(rèn)為研究結(jié)果并不能完全評(píng)估回答引擎的效果,因?yàn)?strong>研究聚焦在回答引擎結(jié)果的可驗(yàn)證性,而不是實(shí)用性,重點(diǎn)在引用值得二次驗(yàn)證以及引用準(zhǔn)確,假設(shè)了用戶要基于生成的結(jié)果,用引用去二次驗(yàn)證搜索結(jié)果。然而,用戶期待的理應(yīng)是無(wú)需二次驗(yàn)證,直接獲得答案,而這種期待往往會(huì)落空,因?yàn)榛卮鹨嫔朴诳偨Y(jié),不善于縫合。

對(duì)于絕大多數(shù)事實(shí)類的問(wèn)題,Perplexity AI 的表現(xiàn)非常好,可以做到無(wú)需外部鏈接即可完成搜索目標(biāo),如搜索 OpenAI Dev Day 更新,SpaceX 火箭發(fā)射情況,塞爾達(dá)傳說(shuō)某神廟攻略等。這類問(wèn)題的特點(diǎn)是,如果用傳統(tǒng)的搜索方式,通常打開(kāi)單個(gè)網(wǎng)頁(yè)即可得到答案,回答引擎則參考多個(gè)信源,總結(jié)出最重要的信息,縮短稱述。

但有時(shí)候,生成的結(jié)果也會(huì)給人一種看起來(lái)很有道理,但是沒(méi)什么用的感覺(jué)。沒(méi)有找到真正有用的信息的原因可能在于這部分信息密度極低,即便是 AI 讀取全部數(shù)據(jù)也無(wú)法高效地抽取精華。那些經(jīng)常被提及的東西,也更有可能是 AI 認(rèn)為重要且最先習(xí)得的東西。如果那目前 transfomer 的自回歸模型來(lái)看似乎也符合邏輯,經(jīng)常出現(xiàn)的高頻信息會(huì)提高被預(yù)測(cè)為下一個(gè)詞的概率?!府?dāng) Perplexity 給出的答案,沒(méi)有比我已知的內(nèi)容更有意義時(shí),Perplexity 表現(xiàn)得像是找不到答案或者答案根本不存在,但在 Google 上搜索時(shí),我還是能在第一頁(yè)中找到一些我真正想要的,更深層次的東西」。

總而言之,用戶對(duì)于不同的搜索問(wèn)題,期望得到不同顆粒度的答案,但是 Perplexity AI 在給出答案時(shí)并不能充分考慮這一點(diǎn),產(chǎn)品本身試圖通過(guò)給出更換模型、引入 Copilot 和編輯搜索關(guān)鍵詞等選項(xiàng)來(lái)克服這個(gè)問(wèn)題,但仍然需要更長(zhǎng)期得優(yōu)化。

2. 使用習(xí)慣不同

搜索引擎優(yōu)化 SEO(Search Engine Optimization)的研究由來(lái)已久,是一種通過(guò)優(yōu)化網(wǎng)站內(nèi)容來(lái)提高網(wǎng)站在搜索引擎結(jié)果中的排名的過(guò)程,關(guān)于搜索,有一些有意思的統(tǒng)計(jì):

  1. 69.6% 的搜索關(guān)鍵詞長(zhǎng)度在 4 個(gè)詞以下
  2. 65% 的情況下,用戶會(huì)在 10 秒內(nèi)從搜索結(jié)果中選擇要跳轉(zhuǎn)的頁(yè)面
  3. 25.6% 的情況用戶不會(huì)點(diǎn)擊任何搜索結(jié)果
  4. 不足 1% 的情況用戶會(huì)瀏覽搜索結(jié)果的第 2 頁(yè)
  5. 59% 左右的用戶一次點(diǎn)擊就能解決問(wèn)題

注:統(tǒng)計(jì)結(jié)果僅參考量級(jí)

大多數(shù)的搜索場(chǎng)景,都是用簡(jiǎn)單的關(guān)鍵詞,用極短的時(shí)間從搜索結(jié)果中篩選,在小于等于一個(gè)頁(yè)面內(nèi)解決問(wèn)題。這種習(xí)慣遷移到回答引擎上,則會(huì)很不適應(yīng),因?yàn)檫@類回答引擎搜索依賴對(duì)問(wèn)題進(jìn)行準(zhǔn)確描述、提示工程和多輪對(duì)話來(lái)優(yōu)化結(jié)果;同時(shí)生成結(jié)果會(huì)需要比傳統(tǒng)搜索引擎更長(zhǎng)的時(shí)間,Perplexity AI 通過(guò)在生成結(jié)果時(shí)先顯示信源,再進(jìn)行生成的方式來(lái)弱化這個(gè)問(wèn)題,但仍慢于傳統(tǒng)方式。

期待值高,使用方式不同就會(huì)導(dǎo)致,對(duì)于傳統(tǒng)搜索中打開(kāi)一個(gè)頁(yè)面就可以解決的快速搜索問(wèn)題,回答引擎需要用更詳細(xì)的搜索條件、更長(zhǎng)的時(shí)間來(lái)得到類似的結(jié)果;對(duì)于依賴多個(gè)頁(yè)面交叉驗(yàn)證補(bǔ)充的復(fù)雜搜索問(wèn)題,回答引擎則顯得信源不全或能力不足,無(wú)法給出足夠有價(jià)值的信息,需要用戶使用傳統(tǒng)搜索引擎重新搜索。

五、能否顛覆搜索引擎?

雖然回答引擎?zhèn)涫芷诖?,但要顛覆傳統(tǒng)搜索引擎仍是一個(gè)遙遠(yuǎn)的目標(biāo)。

以 2019 年成立的 Neeva 為例,這家公司曾是 Google 的潛在挑戰(zhàn)者之一,投入大量資源構(gòu)建自己的索引和排序系統(tǒng),旨在提供比 Google 更好的用戶體驗(yàn),且不含廣告。Neeva 在用戶研究和內(nèi)部指標(biāo)上曾接近 Google 的水平,但僅兩年后即關(guān)閉了面向普通消費(fèi)者的業(yè)務(wù),原因是缺乏足夠用戶。這表明,僅靠?jī)?yōu)化用戶體驗(yàn)難以改變搜索引擎市場(chǎng)的格局。

過(guò)去,搜索引擎建立了深厚的壁壘。微軟的 CEO 納德拉和 Neeva 的聯(lián)合創(chuàng)始人拉馬斯瓦米都表示,搜索引擎是互聯(lián)網(wǎng)中最難攻破的市場(chǎng),絕大多數(shù)用戶都不會(huì)去更改他們的默認(rèn)搜索引擎,同時(shí),越多用戶使用默認(rèn)搜索引擎(Google),那么就可能通過(guò)大量用戶數(shù)據(jù)持續(xù)優(yōu)化搜索結(jié)果,其領(lǐng)先地位似乎難以撼動(dòng)。

除了傳統(tǒng)搜索引擎已經(jīng)建立的壁壘外,回答引擎還有其他基于大模型的產(chǎn)品的常見(jiàn)問(wèn)題要解決,如成本和反饋機(jī)制。

當(dāng)前的回答引擎大多基于傳統(tǒng)搜索引擎和大模型的 API 構(gòu)建,自身更專注于模型和 RAG(Retrieval-Augmented Generation)的優(yōu)化;同時(shí),回答引擎產(chǎn)品普遍沒(méi)有找到合理的商業(yè)模式,Perplexity AI 的許多競(jìng)爭(zhēng)對(duì)手產(chǎn)品仍然完全免費(fèi),而僅靠訂閱機(jī)制的收入,難以滿足對(duì) API 的大量需求,阻止了現(xiàn)階段回答引擎完全替代傳統(tǒng)搜索引擎的可能性。

目前,Perplexity AI 已經(jīng)在嘗試構(gòu)建自己的 WebCrawler、Search index 和 LLM 來(lái)應(yīng)對(duì)不斷增長(zhǎng)的的查詢請(qǐng)求來(lái)降低成本。

此外,回答引擎也沒(méi)能找到像搜索引擎或者信息流推薦一樣,將收集用戶反饋融入產(chǎn)品正常使用中的產(chǎn)品形態(tài),也就很難基于先發(fā)優(yōu)勢(shì)和用戶積累,打造數(shù)據(jù)飛輪。根據(jù) CEO Aravind Srinivas 所述,只有 10% 左右的用戶會(huì)提供反饋,同時(shí)用戶可能因?yàn)楦鞣N原因不喜歡 AI 生成的結(jié)果,用戶不喜歡并不代表結(jié)果生成的不好,很有可能只是因?yàn)?AI 的總結(jié)中丟失了一部分用戶希望的結(jié)果.

正如先前所說(shuō),用戶對(duì)于總結(jié)的預(yù)期并不穩(wěn)定和一致,AI 認(rèn)為的好未必是人類認(rèn)為的好。在這點(diǎn)上,Perplexity AI 不能像谷歌或者 Tiktok 一樣,用戶的每一次點(diǎn)擊或者喜歡都能用于進(jìn)一步優(yōu)化產(chǎn)品,仍然依賴一些外部 Contractor 對(duì)用戶數(shù)據(jù)進(jìn)行標(biāo)注,來(lái)對(duì)模型進(jìn)一步優(yōu)化。

六、不止是搜索引擎

真正威脅搜索引擎的可能不是另一種工具,而是內(nèi)容的中心化式遷移和封閉。

在過(guò)去十幾年中,用戶發(fā)布的內(nèi)容從開(kāi)放的,對(duì)搜索引擎索引支持良好的論壇、博客等,遷移到了對(duì)搜索引擎索引支持不那么好的平臺(tái),如公眾號(hào)、小紅書(shū)、抖音、Instagram,Twitter 甚至 Amazon 等,這些平臺(tái)已成為許多人在特定場(chǎng)景下的首選搜索工具。未來(lái),這些生態(tài)很有可能出現(xiàn)自己的 AI 搜索助手。不止是內(nèi)容平臺(tái),飛書(shū)和 Notion 等知識(shí)管理平臺(tái),也有計(jì)劃推出自己的 AI 搜索助手,體驗(yàn)和使用方法和回答引擎類似,但是搜索范圍聚焦于私有數(shù)據(jù)庫(kù)。

無(wú)論在哪種場(chǎng)景下,AI 驅(qū)動(dòng)的搜索都是用戶和外部信息互動(dòng)的助理,理想狀態(tài)下,AI 驅(qū)動(dòng)的搜索將幫助用戶和信息進(jìn)行一種直觀的雙向?qū)υ?,而非基于關(guān)鍵詞的單向匹配。

除了模型本身對(duì)信息的理解和處理能力,數(shù)據(jù)庫(kù)的大小同樣會(huì)是限制回答引擎類產(chǎn)品天花板的重要因素之一。內(nèi)容平臺(tái)等封閉的平臺(tái)對(duì)搜索引擎的沖擊,同樣會(huì)對(duì)回答引擎的未來(lái)產(chǎn)生影響,如何打造獨(dú)一無(wú)二的數(shù)據(jù)庫(kù),或者接入更多的外部數(shù)據(jù)庫(kù),可能是在產(chǎn)品和模型能力之外的發(fā)展重點(diǎn)。舉例來(lái)說(shuō),Rewind AI 某種程度上,是否也可以視為一種基于用戶錄屏數(shù)據(jù)的搜索產(chǎn)品?

Perplexity AI 的團(tuán)隊(duì)同樣意識(shí)到了搜索引擎的壁壘和內(nèi)容變化的趨勢(shì),因此并沒(méi)有選擇在垂直領(lǐng)域的方向去做產(chǎn)品來(lái)競(jìng)爭(zhēng),如購(gòu)物助手或者生活助手,因?yàn)樵跀?shù)據(jù)上無(wú)法和 Amazon 和 Tiktok 競(jìng)爭(zhēng),而是選擇在成為知識(shí)內(nèi)容平臺(tái)的方向進(jìn)行探索。

通過(guò)讓用戶可以分享和保存自己和 Perplexity AI 的多輪對(duì)話流程,來(lái)試圖建立一個(gè)內(nèi)容社區(qū);盡管目前 AI 在表達(dá)能力上表現(xiàn)出色,但 AI 產(chǎn)生的大量看似可靠,卻并不實(shí)用的內(nèi)容,限制了其成為知識(shí)平臺(tái)的潛力。

但是好的方面是,搜索引擎仍然在大量場(chǎng)景內(nèi),幫助用戶解決實(shí)際問(wèn)題,搜索引擎和回答引擎仍能提供可靠的價(jià)值。

人們常說(shuō),搜索本身即是一種能力,需要對(duì)大量信息進(jìn)行搜集、過(guò)濾、總結(jié)、整合等工作,而這些對(duì)信息的加工是過(guò)去的搜索流程中,存在于搜索主體的工作流中但是無(wú)法被傳播的,更多都在搜索主體的腦內(nèi)和個(gè)人知識(shí)庫(kù)中進(jìn)行處理和加工。而隨著 AI 代替用戶對(duì)信息完成加工的過(guò)程并展示,搜索的過(guò)程本身也具備成為一種可互動(dòng)的內(nèi)容形式的潛力,這或許會(huì)是 Perplexity AI 成為一種內(nèi)容平臺(tái)的可能性。

參考材料:

https://youtu.be/ix4_rdogcVI

編譯:Shiqi,Vela

來(lái)源公眾號(hào):深思SenseAI;關(guān)注全球 AI 前沿,走進(jìn)科技創(chuàng)業(yè)公司,提供產(chǎn)業(yè)多維深思。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @深思SenseAI 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!