搜索功能全流程解析

4 評(píng)論 20799 瀏覽 357 收藏 34 分鐘

在產(chǎn)品中一般會(huì)分布著大大小小的搜索,以便提升用戶的信息獲取效率和信息消費(fèi)的能力。本文作者全流程角度,對(duì)搜索功能進(jìn)行了講解,并從搜索流程中尋找提升體驗(yàn)的觸點(diǎn),一起來看一下吧。

在產(chǎn)品中因多功能訴求和業(yè)務(wù)復(fù)雜性等因素,界面大多有高信息密度和高交互密度的特征,為了讓用戶能快速獲取信息和完成任務(wù),在產(chǎn)品中會(huì)分布著大大小小的搜索,以便提升用戶的信息獲取效率和信息消費(fèi)的能力。

同時(shí)因?yàn)橛脩糨斎雰?nèi)容不可控、解析-匹配-排序規(guī)則的復(fù)雜度、用戶搜索場(chǎng)景的不同等因素,讓搜索功能有一定空間去提升體驗(yàn),所以本文將嘗試從全流程角度講解搜索功能,從搜索流程中尋找提升體驗(yàn)的觸點(diǎn)。

若對(duì)內(nèi)容有疑問或想要探討,希望各位不吝賜教~

本文將通過「激活搜索」、「輸入關(guān)鍵詞」、「解析內(nèi)容」、「召回」、「排序」、「結(jié)果呈現(xiàn)」6個(gè)步驟對(duì)搜索內(nèi)容進(jìn)行拆解說明。其中前三部分和交互強(qiáng)相關(guān),所以本文將重點(diǎn)講解。

一、激活搜索

激活搜索階段最重要的是提供反饋明確當(dāng)前狀態(tài),目前大抵會(huì)有兩種呈現(xiàn)方式。

1. 出現(xiàn)搜索下拉面板,展示搜索歷史or熱門搜索or內(nèi)容引流

如:在飛書文檔中激活搜索時(shí)會(huì)在面板中展示“搜索歷史”和“最近瀏覽”,增加相關(guān)內(nèi)容曝光,去給用戶提供更多選擇以觸達(dá)目標(biāo)內(nèi)容,該交互形式通常出現(xiàn)在全局性搜索或多維度搜索功能中。

再如:在餓了么中激活搜索進(jìn)入搜索頁,不僅會(huì)提供歷史搜索,還有一系列的推薦內(nèi)容和營(yíng)銷榜單的引導(dǎo),達(dá)到商業(yè)運(yùn)營(yíng)的目的。

2. 僅光標(biāo)聚焦到搜索框中

如:Coding的事項(xiàng)列表中點(diǎn)擊搜索,僅光標(biāo)聚焦搜索框。

作為任務(wù)管理工具在使用搜索時(shí)其目標(biāo)是非常明確的,其對(duì)于搜索體驗(yàn)?zāi)繕?biāo)是要求快速匹配內(nèi)容。僅聚焦搜索框中可以減少視覺干擾專注于完成搜索操作。該交互形式常運(yùn)用于B端產(chǎn)品的表格、列表搜索中。

所以在激活搜索階段需要結(jié)合當(dāng)前產(chǎn)品性質(zhì)和搜索場(chǎng)景綜合考慮采用何種反饋形式。

二、輸入關(guān)鍵字

在此之前我們先看幾個(gè)例子:

  • 石墨文檔中,輸入關(guān)鍵字后即開始進(jìn)行搜索行為,并在下拉面板中直接呈現(xiàn)出了搜索結(jié)果
  • 知乎中輸入關(guān)鍵字后即時(shí)出現(xiàn)了關(guān)鍵詞聯(lián)想列表,用戶可選擇回車or點(diǎn)按鈕查看搜索結(jié)果,也可根據(jù)列表切換關(guān)鍵詞后查看結(jié)果。

可以看出不同產(chǎn)品的交互差異,那造成這種差異的原因是什么呢?之前在思考這個(gè)問題的時(shí)候認(rèn)為是B端產(chǎn)品和C端產(chǎn)品的區(qū)別,但仔細(xì)一想這樣劃分過于粗暴。后續(xù)嘗試用搜索場(chǎng)景來解釋發(fā)現(xiàn)會(huì)更合理。

1. 定義搜索場(chǎng)景

在《Web信息架構(gòu)》中對(duì)搜索場(chǎng)景劃分為4類,在結(jié)合具體產(chǎn)品后我將其收縮為2類。

1)已知條目搜索

用戶有非常明確的搜索目標(biāo),是在已知內(nèi)容庫(kù)中快速定位信息。輸入的關(guān)鍵詞就是想要獲取信息主題。

如:想在Jira上看掛在我頭上關(guān)于“組件”的任務(wù),會(huì)直接在列表中搜索“組件”,此時(shí)的搜索結(jié)果即我想要的內(nèi)容。如:查找微信聯(lián)系人,是有非常明確的搜索目標(biāo)。

2)探索式搜索

用戶有模糊的搜索目標(biāo),是在未知內(nèi)容庫(kù)中搜尋信息。是對(duì)于該類信息主題是未知的想要去探索,且大概率是不能精準(zhǔn)描述關(guān)鍵詞和結(jié)構(gòu)化表達(dá)問題。

如:最近在做組件,想看一下相關(guān)文章參考,則會(huì)在一些知識(shí)平臺(tái)上輸入“組件”查找參考。若沒有查找到目標(biāo)內(nèi)容,則不停的切換關(guān)鍵詞“組件規(guī)范”、“組件設(shè)計(jì)”、“基礎(chǔ)組件”進(jìn)行搜索,直到查找到相關(guān)目標(biāo)內(nèi)容。

2. 對(duì)應(yīng)的交互方式

這兩種搜索場(chǎng)景用戶訴求不同導(dǎo)致用戶體驗(yàn)?zāi)繕?biāo)的不同,則在輸入關(guān)鍵詞階段會(huì)提供不同的交互方式。

1)已知條目搜索

體驗(yàn)?zāi)繕?biāo):用戶目標(biāo)明確,需要更快更精準(zhǔn)的提供結(jié)果。

交互方式:輸入關(guān)鍵字過程中進(jìn)行搜索行為,實(shí)時(shí)展示搜索結(jié)果。

2)探索式搜索

體驗(yàn)?zāi)繕?biāo):用戶目標(biāo)模糊,提供關(guān)鍵詞輔助能提供更標(biāo)準(zhǔn)化的關(guān)鍵詞便于更精準(zhǔn)的查找到內(nèi)容。

交互方式:輸入關(guān)鍵字后即時(shí)提供關(guān)鍵詞聯(lián)想,回車進(jìn)行結(jié)果查詢。

從搜索場(chǎng)景角度出發(fā)處于探索式搜索時(shí)可提供「關(guān)鍵詞聯(lián)想」功能提升搜索體驗(yàn),但「關(guān)鍵詞聯(lián)想」在其他產(chǎn)品中也有廣泛的運(yùn)用。

3. 關(guān)鍵詞聯(lián)想的運(yùn)用

1)在內(nèi)容平臺(tái)中以降低用戶輸入成本,提升搜索效率

如:準(zhǔn)備在小紅書上查一下冷凍水餃?zhǔn)抢渌€是熱水下鍋,在輸入冷凍水餃后就出現(xiàn)大量關(guān)聯(lián)問題,可直接切換選擇則完成搜索。

在谷歌中搜索“今日天氣”會(huì)在面板中直接顯示天氣數(shù)據(jù),直接將結(jié)果顯示在關(guān)鍵詞聯(lián)想面板中,減少了跳轉(zhuǎn)成本。

2)商業(yè)化運(yùn)營(yíng)的目的

如:在餓了么搜索“奶茶”,則不僅出現(xiàn)帶“奶茶”的商品,還穿插了奶茶果汁排行榜及奈雪、兵立王的商家關(guān)聯(lián)。其中奈雪多次下單過,所以可能是根據(jù)最近購(gòu)買記錄進(jìn)行優(yōu)先展示,然而兵立王我從未下單過也從未瀏覽過出現(xiàn)在這兒大概率是商業(yè)曝光。

總而言之,關(guān)鍵詞聯(lián)想是適用于探索式搜索場(chǎng)景以提升搜索準(zhǔn)確度和有效性;同時(shí)適用于內(nèi)容平臺(tái)性產(chǎn)品以降低用戶輸入成本;及有營(yíng)銷訴求的產(chǎn)品以滿足商業(yè)化運(yùn)營(yíng)。

所以在設(shè)計(jì)時(shí)應(yīng)當(dāng)考慮產(chǎn)品目標(biāo)和用戶場(chǎng)景去設(shè)計(jì)輸入關(guān)鍵詞階段的交互流程,以提供更好的搜索體驗(yàn)。

三、解析關(guān)鍵詞(Query)

在搜索輸入關(guān)鍵字過程中會(huì)存在拼寫錯(cuò)誤、語義表達(dá)差異等原因?qū)е滤阉鹘Y(jié)果不準(zhǔn)確或搜索無內(nèi)容。所以為了更準(zhǔn)確的理解用戶意圖,加強(qiáng)系統(tǒng)的理解能力通常都會(huì)設(shè)置多種解析規(guī)則,對(duì)關(guān)鍵詞進(jìn)行預(yù)處理、改寫、分詞等,以提供更準(zhǔn)確的搜索結(jié)果。同時(shí)對(duì)關(guān)鍵詞的解析越精準(zhǔn)細(xì)致,搜索顯得越智能高效,也能較大提升搜索體驗(yàn)。

舉個(gè)例子:飛書文檔中輸入“wendang”,能搜索出“文檔”的內(nèi)容;石墨文檔中輸入小寫的“meri”,能搜索出大寫“MERI”的文檔;百度中輸入拼寫錯(cuò)誤的“appla”,能搜索出Apple相關(guān)內(nèi)容。

以上產(chǎn)品所展示的解析能力為「預(yù)處理」、「改寫」、「分詞」三大塊,也是現(xiàn)有產(chǎn)品中最常用的解析能力。當(dāng)然對(duì)于搜索引擎和ChatGPT這類產(chǎn)品會(huì)有更專業(yè)化更復(fù)雜的的解析流程本文暫不涉及,主要是超過我知識(shí)范圍了…下文將根據(jù)常用的這三塊內(nèi)容詳細(xì)講解。

1. 預(yù)處理

預(yù)處理指將關(guān)鍵詞進(jìn)行字符轉(zhuǎn)化、刪除、截?cái)嗵幚矸奖愫罄m(xù)進(jìn)行分析。其目的是轉(zhuǎn)化和簡(jiǎn)化關(guān)鍵詞,更好的理解用戶意圖,以提供更合適的搜索結(jié)果。

預(yù)處理具體分為以下幾種能力:

1)拼音轉(zhuǎn)文字

輸入拼音時(shí)可轉(zhuǎn)化為文字進(jìn)行結(jié)果查詢,如:輸入“chanpinsheji”,將轉(zhuǎn)化為“產(chǎn)品設(shè)計(jì)”進(jìn)行搜索。就從個(gè)人日常使用搜索功能而言,常會(huì)忘記切換輸入法直接輸入了拼音,此時(shí)提供該能力也能進(jìn)行有效搜索時(shí)是能帶來體驗(yàn)上的驚喜感。

功能雖好,但也不一定產(chǎn)品內(nèi)所有搜索功能都需要加上拼音轉(zhuǎn)文字能力,這個(gè)也是需要結(jié)合當(dāng)前搜索場(chǎng)景和用戶行為具體分析是否為一個(gè)高ROI功能。

如:在一些B端 CRM系統(tǒng)中客服人員會(huì)通過搜索客戶名稱進(jìn)行資料錄入,此時(shí)的搜索場(chǎng)景大多是在IM聊天窗口中復(fù)制客戶名稱再粘貼到搜索框中從而完成搜索行為。此時(shí)的搜索大多不會(huì)牽扯到手動(dòng)輸入,此時(shí)拼音轉(zhuǎn)文字能力作用也不大。

2)大小寫轉(zhuǎn)換

大寫字母轉(zhuǎn)換為小寫字母進(jìn)行結(jié)果查詢,即不論用戶輸入大寫或小寫字母都能查詢到對(duì)應(yīng)結(jié)果。

如:輸入“f6”,能搜索出大寫“F6”的內(nèi)容。

該能力適用于帶有字母的結(jié)果數(shù)據(jù)。舉個(gè)例子,在ERP系統(tǒng)中有大量的企業(yè)物資信息,其中對(duì)于一些固定資產(chǎn)通常會(huì)以“樓層+設(shè)備名+設(shè)備編號(hào)”來進(jìn)行命名,如:“F6-iMac-7842”,字段為大小寫字母混排,存在較高的輸入成本。若提供大小寫轉(zhuǎn)換,則直接輸入“f6-imac-7842”也能出現(xiàn)對(duì)應(yīng)結(jié)果。

3)繁簡(jiǎn)體轉(zhuǎn)換

將繁體字轉(zhuǎn)化為簡(jiǎn)體字進(jìn)行搜索,該能力則適用于涉及到繁體字使用習(xí)慣地區(qū)用戶,本次就不再贅述。

4)無意義字符移除

無意義字符包括特殊符號(hào)(emjio、表情符號(hào)、連續(xù)的空格符等)和無意義字符(“的”、“了”、“么”、“哈”等語氣組詞)。無意義字符會(huì)打包成一個(gè)《停用詞庫(kù)》作為搜索配置庫(kù)存在,且目前有大量的開源《停用詞庫(kù)》可直接調(diào)用,所以具體停用哪些字符可基于開源詞庫(kù)的內(nèi)容再結(jié)合業(yè)務(wù)訴求進(jìn)行增刪。

舉個(gè)例子,在飛書文檔中輸入“會(huì)議”且中間插入多個(gè)空格,依舊能搜索出帶“會(huì)議”的文檔。

注意看輸入框下方第一行文字“在高級(jí)搜索中查看 ‘會(huì) 議’ ”,將“會(huì) 議+6空格”縮短成“會(huì) 議+1空格”,僅保留了一個(gè)空格作為分詞符,去掉了多余的空格符。

而在石墨文檔中輸入“設(shè)計(jì)”能查詢到內(nèi)容,若中間插入多個(gè)空格則搜索無結(jié)果。石墨則是將所有輸入內(nèi)容作為有效字符進(jìn)行搜索,進(jìn)而搜索結(jié)果為空。

從體驗(yàn)上來看,飛書文檔通過增加系統(tǒng)搜索規(guī)則來減少錯(cuò)誤輸入導(dǎo)致的無結(jié)果,增加了系統(tǒng)容錯(cuò)性,來提供更多的可能性,減少空數(shù)據(jù)帶來的失落感。

插入一個(gè)關(guān)于空格的小細(xì)節(jié):

當(dāng)初寫搜索功能的交互說明時(shí),被測(cè)試問道如果輸入連續(xù)的空格如何響應(yīng)?當(dāng)時(shí)想的是誰沒事干輸那么多空格,但作為一個(gè)專業(yè)的和藹可親的設(shè)計(jì)師怎么能將心里話說出來呢。所以趕緊看了各大產(chǎn)品的處理方式以便于合理借鑒,發(fā)現(xiàn)主要分為以下幾種類型:

  1. 輸入多個(gè)空格后,搜索結(jié)果面板顯示無結(jié)果,點(diǎn)擊回車無響應(yīng)
  2. 不允許輸入空格,輸入非空格字符后才能輸入空格

總的來說,分為兩類一種是前置防錯(cuò),直接不允許輸入,在數(shù)據(jù)結(jié)構(gòu)中大多數(shù)情況中不存在多空格數(shù)據(jù)的存在;另一種是后置反饋,允許輸入任何字符無匹配內(nèi)容則顯示無結(jié)果,這種處理方式更簡(jiǎn)單直接,不做任何特殊處理有結(jié)果就顯示沒有結(jié)果就為空,給予用戶最大的操作自由同時(shí)邏輯也統(tǒng)一。

個(gè)人角度更偏向第二種,即保證用戶輸入的自由度,通過搜索規(guī)則合理去除無意義字符,此時(shí)還未有對(duì)應(yīng)匹配內(nèi)容則應(yīng)當(dāng)告知用戶無結(jié)果,告知用戶嘗試用其他關(guān)鍵詞進(jìn)行搜索。同時(shí)也減少規(guī)則的復(fù)雜度。

5)長(zhǎng)度截?cái)?/strong>

即將超過設(shè)定長(zhǎng)度的關(guān)鍵詞進(jìn)行截?cái)啵瑴p少查詢壓力。如百度的查詢限制為38個(gè)漢字,谷歌的查詢限制為32個(gè)詞。

總的來說,預(yù)處理中的「拼音轉(zhuǎn)文字」、「大小寫轉(zhuǎn)換」、「繁簡(jiǎn)體轉(zhuǎn)換」是通過增加系統(tǒng)判斷規(guī)則的復(fù)雜度來減少用戶輸入的復(fù)雜度,降低用戶的輸入門檻和成本,提升用戶操作的自由度。「無意義字符移除」和「長(zhǎng)度截?cái)唷箘t是合理篩查關(guān)鍵詞,精簡(jiǎn)表達(dá)提升搜索結(jié)果的準(zhǔn)確度。

2. 分詞

分詞是當(dāng)輸入關(guān)鍵詞無法與數(shù)據(jù)庫(kù)完全匹配時(shí),則會(huì)將關(guān)鍵詞拆分為多個(gè)Term(Term可以是詞組也可是漢字)再與數(shù)據(jù)庫(kù)匹配。如:“九轉(zhuǎn)大腸”無匹配內(nèi)容時(shí)可拆分為“九轉(zhuǎn)”、“大腸”兩個(gè)詞組或拆分為“九”、“轉(zhuǎn)”、“大”、“腸”四個(gè)漢字進(jìn)行匹配。

分詞的關(guān)鍵在于怎么分?在英文語句中“You are awesome.”用空格隔開了三個(gè)單詞,若用這句話進(jìn)行分詞搜索則自然會(huì)拆分成“you”、“are”、“awesome”三個(gè)單詞。

在中文表達(dá)中沒有空格,且中文分詞不合適就會(huì)形成不同的語義表達(dá)。如“上海市長(zhǎng)江大橋”可分詞為“上海市”、“長(zhǎng)江大橋”,也可以是“上海市長(zhǎng)”、“江大橋”。

目前大多數(shù)產(chǎn)品都是采用的基于詞典的分詞方法,即維護(hù)一個(gè)分詞庫(kù),若輸入的關(guān)鍵詞命中分詞庫(kù)中的詞語時(shí),則能召回詞語對(duì)應(yīng)的內(nèi)容。

舉個(gè)例子,在飛書文檔中輸入“頭腦”,會(huì)出現(xiàn)包含“頭腦”詞語的文檔;若輸入“頭腦暴”,則無結(jié)果。這是將“頭腦暴”作為一個(gè)詞組參與搜索,沒有命中分詞庫(kù)數(shù)據(jù)庫(kù)也無匹配內(nèi)容。

在石墨文檔的結(jié)果匹配中則是將分詞邏輯直接用分隔符顯示出來了。如:輸入“小李的工作內(nèi)容”首先停用了“的”,然后拆分為“小李”、“工作”、“內(nèi)容”三個(gè)詞組進(jìn)行結(jié)果匹配。

但基于分詞庫(kù)進(jìn)行分詞會(huì)存在一定的維護(hù)成本,如:出現(xiàn)新詞則需要手動(dòng)添加等。

隨著分詞技術(shù)的成熟,已經(jīng)形成一套更為智能化的分詞方法和工具服務(wù),會(huì)加入深度學(xué)習(xí)模型分析讓其更智能的分詞。因?yàn)檫@塊過于后端技術(shù)化所以不多贅述,有興趣的同學(xué)可查看《中文分詞的原理、方法與工具》這篇文章有詳細(xì)介紹。

分詞能力廣泛運(yùn)用于探索式搜索場(chǎng)景的產(chǎn)品中,通過分詞技術(shù)將關(guān)鍵詞合理拆分重組,以召回更多相關(guān)內(nèi)容,其注重的是查全率。所以在內(nèi)容資訊產(chǎn)品(如:知乎、語雀、微信搜一搜)中通常都會(huì)運(yùn)用分詞技術(shù)召回大量?jī)?nèi)容以滿足用戶查詢需求。

3. 改寫

改寫指的是將輸入關(guān)鍵詞改寫為另一個(gè)能與數(shù)據(jù)內(nèi)容匹配的關(guān)鍵詞,具體可分為三個(gè)方向。

  • 將拼寫錯(cuò)誤的關(guān)鍵詞糾錯(cuò)改為拼寫正確的字詞;
  • 將不同文字表達(dá)但是同義的字詞統(tǒng)一歸為更為標(biāo)準(zhǔn)的字詞;
  • 將輸入關(guān)鍵詞擴(kuò)展出與其內(nèi)容或行為語義相關(guān)的字詞列表,推薦給用戶便于對(duì)潛在需求挖掘發(fā)現(xiàn)。

1)糾錯(cuò)

將拼寫錯(cuò)誤的關(guān)鍵詞糾錯(cuò)改為拼寫正確的字詞。如:在知乎輸入拼寫錯(cuò)誤單詞“appla”,系統(tǒng)自動(dòng)將關(guān)鍵詞修改為“apple”,并展示了對(duì)應(yīng)結(jié)果。

相比英文單詞拼寫糾錯(cuò),中文字詞的糾錯(cuò)則更為復(fù)雜。如:中文字若通過拼音輸入時(shí)就存在模糊音(平翹舌、前后鼻音等)、同音字錯(cuò)誤;若通過五筆輸入時(shí)就存在形近字錯(cuò)誤等。

在騰訊搜索技術(shù)文檔中將錯(cuò)誤類型分為「Non-word Error」指不存在于詞典中的錯(cuò)誤字詞;「Real-word Error」指由多個(gè)漢字組成的詞語錯(cuò)誤。且這兩個(gè)大類還可以繼續(xù)拆分更小粒度的錯(cuò)誤類型。

當(dāng)然圖上的錯(cuò)誤類型是全集,搜索引擎基于產(chǎn)品特性是大面積覆蓋了這些錯(cuò)誤類型。除搜索引擎的產(chǎn)品則可根據(jù)產(chǎn)品定位和場(chǎng)景進(jìn)行選擇性實(shí)現(xiàn)。

如:在釘釘?shù)娜炙阉髦兴阉髀?lián)系人就采用了「簡(jiǎn)拼」、「漢字+拼音組合」、「混淆音」、「顛倒」等糾錯(cuò)方式。但這些糾錯(cuò)能力也僅限于聯(lián)系人,針對(duì)聊天記錄和文檔里的內(nèi)容則不涉及。

仔細(xì)一想,很合理且必要。

聯(lián)系人數(shù)量有限,且名字是會(huì)存在生僻字,容易拼寫錯(cuò)誤,且在使用釘釘中搜索聯(lián)系人是一個(gè)高頻行為,提供關(guān)鍵詞糾錯(cuò)能力,是允許用戶出錯(cuò)的同時(shí)加強(qiáng)系統(tǒng)的判斷能力并提供合適的解決方案呈現(xiàn)給用戶,從而減少不必要的錯(cuò)誤提示和空頁面。

而聊天記錄和文檔則會(huì)因?yàn)槭褂脮r(shí)間不斷累加數(shù)據(jù)量,若提供過于強(qiáng)大的糾錯(cuò)能力會(huì)召回大量低匹配度內(nèi)容導(dǎo)致搜索結(jié)果不夠簡(jiǎn)練準(zhǔn)確。

2)歸一

將不同字詞但是同義的字詞統(tǒng)一歸為更為標(biāo)準(zhǔn)的字詞再做數(shù)據(jù)匹配。其目的是為了解決在表達(dá)中存在的語義差異,如:“iPhone手機(jī)價(jià)格”、“iPhone手機(jī)售價(jià)”、“iPhone手機(jī)多少錢”三種不同的語義都是表達(dá)統(tǒng)一含義,則可以將這三種表達(dá)都?xì)w一到“iPhone手機(jī)價(jià)格”的標(biāo)準(zhǔn)字詞。

同停用詞庫(kù),同義詞也會(huì)打包成為一個(gè)《同義詞庫(kù)》,且目前已有開源的詞庫(kù),可在現(xiàn)有業(yè)務(wù)基礎(chǔ)上進(jìn)行增刪同義詞。

如:之前設(shè)計(jì)產(chǎn)品中有針對(duì)整棟建筑內(nèi)所有設(shè)備和空間的搜索,其中針對(duì)“衛(wèi)生間”同義的詞語包括“廁所”、“洗手間”、“盥洗室”,所以就設(shè)置了將這三類詞語歸一為“衛(wèi)生間”。這樣在輸入“廁所”時(shí)也能查詢“衛(wèi)生間”的數(shù)據(jù)內(nèi)容。

3)擴(kuò)展

將輸入關(guān)鍵詞擴(kuò)展出與其內(nèi)容或行為語義相關(guān)的字詞列表,推薦給用戶便于對(duì)潛在搜索需求挖掘,該功能也稱為關(guān)鍵詞聯(lián)想。在本文的2.3「關(guān)鍵詞聯(lián)想的運(yùn)用」階段對(duì)其有描述,在此就不贅述了。

隨著搜索內(nèi)容越來越復(fù)雜和多語義化,解析關(guān)鍵詞會(huì)越來越重要。只有不斷細(xì)化和更新解析規(guī)則才能更準(zhǔn)確理解用戶意圖,以盡可能獲得更準(zhǔn)確的結(jié)果,增強(qiáng)搜索結(jié)果有效性。

話鋒強(qiáng)硬一轉(zhuǎn),插入一個(gè)小話題。在網(wǎng)上看了多篇關(guān)于搜索的文章,發(fā)現(xiàn)大家對(duì)于“模糊搜索”和“精確搜索”的定義都有所不同,借此來說說自己的理解。

①精確搜索(=):即關(guān)鍵字和內(nèi)容完全匹配

例如:輸入“九轉(zhuǎn)大腸”,只會(huì)出現(xiàn)“九轉(zhuǎn)大腸”,關(guān)鍵詞與結(jié)果需完全一一對(duì)應(yīng)。

②模糊搜索(like):即關(guān)鍵字和內(nèi)容不完全匹配也能出現(xiàn)結(jié)果,關(guān)鍵字與結(jié)果部分匹配即可

例如:輸入“九轉(zhuǎn)大腸”,會(huì)出現(xiàn)“九轉(zhuǎn)大腸俞濤”、“頂級(jí)廚師九轉(zhuǎn)大腸”、“九轉(zhuǎn)小腸”、“九轉(zhuǎn)豬肚”、“紅燒大腸”。

舉個(gè)例子,來看看知網(wǎng)當(dāng)中可對(duì)搜索結(jié)果進(jìn)行精確和模糊搜索,其搜索結(jié)果區(qū)別。

同時(shí)在解析關(guān)鍵詞這一環(huán)節(jié)中預(yù)處理、分詞、改寫這些能力也是對(duì)模糊匹配能力的進(jìn)一步細(xì)化,如:輸入拼音、輸入首字母簡(jiǎn)寫、同音字等也可進(jìn)行匹配。

所以在做設(shè)計(jì)需求時(shí)應(yīng)該明確模糊匹配是需要模糊到何種程度,而不是用該搜索支持模糊匹配一句話帶過。

四、召回

召回指的是關(guān)鍵詞經(jīng)過解析后與數(shù)據(jù)庫(kù)內(nèi)容進(jìn)行匹配,尋找到與之匹配內(nèi)容的過程,也就是系統(tǒng)在篩選符合用戶搜索需求的內(nèi)容。

在這個(gè)階段后端同學(xué)會(huì)通過倒排索引技術(shù)來建立關(guān)鍵詞與數(shù)據(jù)庫(kù)的關(guān)系,提升搜索查詢效率。簡(jiǎn)單來說就是建立類別清晰的目錄便于快速查找目標(biāo)內(nèi)容。

所以查詢速度則與該環(huán)節(jié)強(qiáng)相關(guān),該環(huán)節(jié)倒排索引建設(shè)的越合理查詢速度越快。這塊內(nèi)容因純?yōu)楹蠖思夹g(shù)方向,所以也不多贅述。

五、排序

當(dāng)在數(shù)據(jù)庫(kù)中查詢到多個(gè)結(jié)果時(shí),則需要通過排序規(guī)則以優(yōu)先級(jí)展示給用戶。合理的排序規(guī)則是將結(jié)果有效呈現(xiàn)的關(guān)鍵因素。

排序可大致分為兩個(gè)方向,一種是根據(jù)匹配度+數(shù)據(jù)參數(shù)進(jìn)行優(yōu)先級(jí)排序,如:搜索訂單、任務(wù)、事項(xiàng)這類數(shù)據(jù)時(shí),可優(yōu)先根據(jù)匹配度(如:匹配度越高越靠前),若匹配度一致則再根據(jù)訂單、任務(wù)、事項(xiàng)的數(shù)據(jù)參數(shù)排(如:創(chuàng)建時(shí)間倒序,可根據(jù)業(yè)務(wù)需要選擇具體參數(shù))排序。

如在Coding上搜索“組件”事項(xiàng),出現(xiàn)了4條包含組件條目的事項(xiàng)內(nèi)容,其中狀態(tài)和優(yōu)先級(jí)一致時(shí),其ID是呈倒序,所以猜測(cè)Coding有一條排序的規(guī)則是根據(jù)ID序號(hào)倒序排序。

二種是根據(jù)加入多維度算法綜合打分排序,將評(píng)分結(jié)果越高的搜索結(jié)果越靠前??筛鶕?jù)數(shù)據(jù)類型列舉參數(shù)進(jìn)行計(jì)算。用內(nèi)容資訊類產(chǎn)品舉例,其通常會(huì)設(shè)置閱讀量、評(píng)論率、時(shí)效性等數(shù)據(jù)指標(biāo)+權(quán)重計(jì)算得分進(jìn)行排序。

如:在微信搜一搜中搜索文章、知乎搜索回答都有其一套默認(rèn)的數(shù)據(jù)指標(biāo)排序規(guī)則。

隨著搜索能力的成熟,目前也形成了一套專業(yè)化的排序方案,詳細(xì)內(nèi)容可參考《一文帶你了解搜索功能設(shè)計(jì)》,在此也不多贅述。

六、結(jié)果呈現(xiàn)

作為搜索功能最后一環(huán),清晰有效的展示搜索結(jié)果是其關(guān)鍵要素。

目前在各大搜索引擎中都逐步優(yōu)化成基于關(guān)鍵字類型展示不同的結(jié)果形式,根據(jù)關(guān)鍵字類型盡可能多的曝露信息,便于用戶快速觸達(dá)和獲取信息,減少跳轉(zhuǎn)步驟。

如:在谷歌中搜索“日出”則首要出現(xiàn)圖片;搜索“杉木”首要匹配百科鏈接;搜索“iPhone 13”則首要匹配且定位到Apple官網(wǎng)中購(gòu)買iPhone13的鏈接。

但在其他產(chǎn)品中是如何有效曝露結(jié)果信息,讓用戶能更快速有效的選擇內(nèi)容呢?

來看一下文檔類產(chǎn)品,石墨和飛書,其下拉面板中展示搜索結(jié)果,同時(shí)也可hover結(jié)果條目時(shí)出現(xiàn)popover去預(yù)覽文檔內(nèi)容。

再來看看語雀,搜索結(jié)果中則是展示了標(biāo)題和部分內(nèi)容。整體看起來信息密度過于大,沒有重點(diǎn),很難識(shí)別到重要信息。特別是在查找公開知識(shí)庫(kù)內(nèi)容時(shí),從標(biāo)題和描述文字很難感知具體內(nèi)容質(zhì)量,所以需要打開多個(gè)文檔查看內(nèi)容,有較大的查找成本。

總之,在搜索結(jié)果呈現(xiàn)界面中應(yīng)該根據(jù)結(jié)果形式特點(diǎn)去設(shè)計(jì)搜索結(jié)果頁,或是通過有序分類導(dǎo)航或是以靈活化的結(jié)果展示形式等,為用戶提供更可視化的結(jié)果,減少用戶查找和跳轉(zhuǎn)成本。

七、打個(gè)總結(jié)

本文拆解了搜索這么多能力,那產(chǎn)品內(nèi)的搜索都需要實(shí)現(xiàn)這些能力嗎?

個(gè)人認(rèn)為不是的。

首先不同產(chǎn)品搜索場(chǎng)景不同,重要度不同,其對(duì)搜索功能完備度要求也不一樣。

其次在做產(chǎn)品設(shè)計(jì)過程中因產(chǎn)品商業(yè)目標(biāo)、功能規(guī)劃、技術(shù)限制等是不可能一次性將功能做完美到極致,這時(shí)候就需要設(shè)計(jì)師從用戶體驗(yàn)出發(fā)結(jié)合客觀條件因素限制提出性價(jià)比更高的解決方案?;蚴莾?yōu)先實(shí)現(xiàn)核心場(chǎng)景的高頻使用痛點(diǎn),或是優(yōu)先實(shí)現(xiàn)核心用戶的使用痛點(diǎn),實(shí)現(xiàn)設(shè)計(jì)價(jià)值最大化。

同時(shí)當(dāng)設(shè)計(jì)師對(duì)功能底層邏輯了解的越透徹,在產(chǎn)品和開發(fā)面前也更有“議價(jià)”的權(quán)利,從而提升設(shè)計(jì)師話語權(quán),更好的讓設(shè)計(jì)產(chǎn)生價(jià)值。

所以打工人追求Work Life Balance,體驗(yàn)設(shè)計(jì)師應(yīng)該追求Business Experience Balance。

參考文章:

  1. Google 自動(dòng)完成功能在搜索中的工作原理
  2. 搜索聯(lián)想詞產(chǎn)品實(shí)踐系列(一):定位-評(píng)估和召回篇
  3. 騰訊搜索:搜索中的 Query 理解及應(yīng)用
  4. 中文分詞的原理、方法與工具
  5. 阿里云:智能開放搜索OpenSearch

本文由 @0479 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 很全

    來自浙江 回復(fù)
  2. 干貨滿滿!感謝大佬分享

    來自北京 回復(fù)
  3. 受教了,感謝大佬

    來自上海 回復(fù)
  4. 寫的真好

    來自北京 回復(fù)