微博APP「搜索」功能分析
本文從用戶需求滿足的使用場景出發(fā),進行典型方案拆解、業(yè)務邏輯分析,探討搜索功能在功能和策略方面的迭代優(yōu)化。
一、項目背景
選擇query調(diào)研微博搜索功能對用戶需求滿足情況,從以下兩個維度對所選擇query進行分類,
- 內(nèi)容類型維度:社會、影視娛樂、時尚美妝、體育運動、旅游、美食、互聯(lián)網(wǎng)、文娛、科普教育、生活記錄;
- 需求理解維度:需求明確-結(jié)構(gòu)簡單清晰的query、需求明確-口語化的query、需求明確有額外條件、需求不明確。
因此進行case調(diào)研的query如下圖所示:
在微博手機客戶端搜索這些query,記錄得到的結(jié)果與相應的問題,匯總case如下圖所示。
由于是手機截圖,粘貼到文章里會比較占地方,所以本文就沒有粘貼本次調(diào)研的實際情況截圖,大家感興趣的話可以用微博自己搜一下試試看。
對以上case中,存在問題的case進行分析,如下圖所示。
匯總這些case的問題原因,即需要針對性解決的問題,如下圖所示。
二、項目目標
1. 產(chǎn)品目標
用戶以最低成本獲得需要的信息。
2. 核心指標定義
用戶搜索成功率,即用戶在搜索query后,沒有后續(xù)行為(包括更改query,切換tab等),直接獲得需要的結(jié)果的概率。
3. 重要指標定義
- query解析準確率,即query解析準確的概率;
- 匹配準確率,即第一結(jié)果匹配準確的概率;
- 前10排序準確率,即前10結(jié)果排序準確的概率;
- Query前10結(jié)果相關性,即一個query前10條結(jié)果與該query相關的概率。
case以上5個指標的滿足情況如下圖所示:
- 用戶搜索成功率:27.50%;
- query解析準確率:50.00%;
- 匹配準確率:40.00%;
- 前10排序準確率:35.00%;
- Query前10結(jié)果相關性:52.50%。
4. 項目目標
- 用戶搜索成功率提升至40.00%;
- Query解析準確率提升至60.00%;
- 匹配準確率提升至60.00%;
- 前10排序準確率提升至50.00%;
- Query前10結(jié)果相關性提升至70.00%。
三、需求概述
針對本次項目需要解決的問題,設計相應改進方案,并根據(jù)問題影響面&預期可解決影響面與成本,排列解決方案優(yōu)先級,如下圖所示。
四、需求詳述
1. query解析
(1)改進方案一
方案:query解析增強常用口語詞庫與口語轉(zhuǎn)義詞庫,提高對query的口語識別能力。
邏輯說明:對口語化query,利用常用口語詞庫找出query中的口語,再利用口語轉(zhuǎn)義詞庫進行轉(zhuǎn)義,獲得需求明確的簡要query后再進行切詞工作。
Case舉例:
(2)改進方案二
方案:query解析提高切詞正確性,對長query允許以多種query處理結(jié)果進行搜索。
邏輯說明:當用戶輸入較長query時,不僅能夠針對query整體對微博結(jié)果進行召回,同時能夠在切詞后,對query進行處理,轉(zhuǎn)換為多種可能的query,去除query中一些無關緊要的詞,并再次對微博結(jié)果進行召回。通過多次召回,在所有結(jié)果中,命中匹配相關性最好的微博。
Case舉例:
(3)改進方案三
方案:query解析增強轉(zhuǎn)義詞庫,提高對query額外條件的識別能力
邏輯說明:用戶輸入的query,在切詞后,能夠通過轉(zhuǎn)義詞庫,提取出query中的額外條件,在匹配與排序的邏輯中為該標簽增加權(quán)重
Case舉例:
(4)改進方案四
方案:query解析增強專有名詞庫,提高對query需求主體識別能力。
邏輯說明:對query切詞后,根據(jù)專有名詞庫找出query主體。
Case舉例:
2. 結(jié)果匹配
(1)改進方案五
方案:匹配邏輯中,根據(jù)搜索query,提高匹配閾值,增加權(quán)威性、熱度、時效性、原創(chuàng)性、內(nèi)容相關性標簽權(quán)重
邏輯說明:當用戶搜索query較為復雜或長度較長,同時具有額外條件時,需要提高對召回結(jié)果的匹配閾值,過濾相關性較低的微博。
除此之外根據(jù)搜索query本身的特性與提取出的額外條件,增加與額外條件對應的權(quán)威性、熱度、時效性、原創(chuàng)性等標簽的權(quán)重。
Case舉例:
(2)改進方案六
方案:根據(jù)搜索query,召回結(jié)果中,對數(shù)量異常多,熱度異常高等特殊情況導致的達到命中閾值的結(jié)果進行異常處理,減少刷量等行為帶來的錯誤匹配命中。
邏輯說明:根據(jù)搜索query,召回結(jié)果中,當出現(xiàn)某一類型結(jié)果微博數(shù)量異常多,或某一結(jié)果微博熱度異常高,導致輕易突破匹配閾值的情況,需要針對性提高這一類搜索query內(nèi)容相關性標簽的權(quán)重,并將內(nèi)容相關性作為一個輔助閾值。
綜合閾值突破,然而內(nèi)容相關性閾值未突破的情況下,對該類召回結(jié)果做特殊處理(不匹配,或者折疊,或者去重)。從而減少刷量、刷熱度等行為帶來的錯誤匹配命中。
Case舉例:
3. 結(jié)果排序
(1)改進方案七
方案:在用戶的連續(xù)搜索行為中,提高排序邏輯中上下文場景之間的關聯(lián)性標簽權(quán)重以及更新時效,提高連續(xù)搜索行為中同一主體的關聯(lián)性。
邏輯說明:在用戶具有連續(xù)搜索行為時,觸發(fā)該邏輯。針對用戶搜索query之間的相關性(例如鹿晗電影、鹿晗),在召回結(jié)果匹配時,提高與之前的搜索行為有關聯(lián)的標簽權(quán)重,并提高這類標簽的更新時效,及時更新。
Case舉例:
4. 結(jié)果展示
(1)改進方案八
方案:調(diào)整特定詞匯(名詞,范圍如歷史人物、特定名詞)的頁面展示邏輯
邏輯說明:框定部分詞匯范圍(如莎士比亞,名人類;片兒川,風土類),調(diào)整該類詞匯搜索結(jié)果的頁面展示順序邏輯,優(yōu)先展示百科信息,并優(yōu)先展示熱門問答、熱門文章等信息。
Case舉例:
5. 資源分析
(1)改進方案九
方案:提高對站內(nèi)微博信息的語義分析準確率,優(yōu)化匹配結(jié)果
邏輯說明:通過名詞轉(zhuǎn)義、口語詞庫與轉(zhuǎn)義、轉(zhuǎn)有名詞庫、切詞等手段,提高對站內(nèi)微博信息的語義分析準確率,優(yōu)化匹配結(jié)果。
Case舉例:
五、統(tǒng)計需求
統(tǒng)計如下指標,對優(yōu)化需求效果進行評估。
本文由 @misbone 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
寫的好好,學習了!
為啥要英文單詞