策略產(chǎn)品經(jīng)理子方向:搜索策略產(chǎn)品
搜索策略產(chǎn)品的工作可能會(huì)遇到哪些場(chǎng)景和流程?這篇文章里,作者基于工作中的搜索項(xiàng)目,從5個(gè)主要問(wèn)題出發(fā)做了拓展和闡述,一起來(lái)看看吧。
基于工作中的搜索項(xiàng)目,進(jìn)行相關(guān)搜索策略產(chǎn)品工作的總結(jié),本文主要匯總了以下5個(gè)問(wèn)題進(jìn)行拓展敘述:
- 搜索場(chǎng)景主要模塊
- 搜索場(chǎng)景常見(jiàn)名詞解釋
- 搜索場(chǎng)景核心流程
- 優(yōu)化目標(biāo)的制定
- 搜索場(chǎng)景需要建設(shè)及優(yōu)化方向
一、搜索場(chǎng)景主要模塊
市面上常見(jiàn)的產(chǎn)品,搜索場(chǎng)景基本上都是由搜索入口、搜索中間頁(yè)、搜索結(jié)果頁(yè)這三部分組成,如下:
- 搜索入口:搜索框+底紋詞(搜索框自帶的推薦詞)
- 搜索中間頁(yè):歷史搜索、熱門(mén)搜索/搜索發(fā)現(xiàn)、聯(lián)想詞、主動(dòng)搜索、中間頁(yè)搜索榜單(或運(yùn)營(yíng)banner)
- 搜索結(jié)果頁(yè):搜索結(jié)果頁(yè)feed流、排序/篩選功能模塊、廣告位、運(yùn)營(yíng)位/banner
各產(chǎn)品細(xì)拆下來(lái)還有很多模塊,雖然模塊較多,但這些模塊存在的核心目標(biāo)都是為了讓用戶在搜索場(chǎng)景快速找到精確目標(biāo)內(nèi)容,提升轉(zhuǎn)化和用戶體驗(yàn)。
二、搜索場(chǎng)景常見(jiàn)名詞解釋
1. query
query即用戶搜索詞,在眾多模塊中,搜索詞可能是用戶主動(dòng)輸入的,也可能是點(diǎn)擊歷史搜索詞/熱門(mén)搜索詞/聯(lián)想詞/底紋詞等等跳轉(zhuǎn)搜索結(jié)果頁(yè)的內(nèi)容,也都算作搜索詞,也叫關(guān)鍵詞。
2. 相關(guān)性
相關(guān)性是用戶搜索詞與搜索頁(yè)面內(nèi)容的相關(guān)程度,比較簡(jiǎn)單場(chǎng)景的是從用戶畫(huà)像和內(nèi)容文本的相關(guān)性去衡量相關(guān)性。大概的做法是隨機(jī)抽取一部分用戶的搜索詞及對(duì)應(yīng)的搜索結(jié)果內(nèi)容,拿用戶畫(huà)像中的部分畫(huà)像字段,再拿搜索結(jié)果的物品的相關(guān)字段,人工定義2邊的字段內(nèi)容是否相關(guān)以及相關(guān)性強(qiáng)度等。
3. 索引&倒排索引
1)索引
索引是一種像書(shū)籍目錄一樣快速查詢數(shù)據(jù)的結(jié)構(gòu),能夠快速定位和查找數(shù)據(jù)。索引能夠?qū)⒉樵儾僮鞯臅r(shí)間復(fù)雜度從遍歷整個(gè)文檔集合降低到對(duì)索引的查詢,大大提升效率。
2)倒排索引
倒排索引是搜索引擎中最常用的索引結(jié)構(gòu)之一,尤其適用于文本檢索場(chǎng)景。其工作原理主要包括以下步驟:
- 文檔分詞:首先,對(duì)每一個(gè)文檔(如職位描述或簡(jiǎn)歷)進(jìn)行分詞處理,將文本分割成單個(gè)單詞或短語(yǔ),稱為“詞元”。這個(gè)過(guò)程可能包括去除停用詞(如“的”、“和”等)、詞形還原(將單詞變?yōu)槠湓?,如“running”變?yōu)椤皉un”)等。
- 詞項(xiàng)記錄:為每一個(gè)獨(dú)特的詞元?jiǎng)?chuàng)建一個(gè)項(xiàng)記錄,這個(gè)記錄包含該詞出現(xiàn)的所有文檔ID列表及其在文檔中的位置信息。這是倒排索引的精髓,它把“詞”到“文檔”的映射關(guān)系反轉(zhuǎn)過(guò)來(lái),就是倒排。
- 壓縮與優(yōu)化:為了節(jié)省空間和提高效率,會(huì)對(duì)這些記錄進(jìn)行壓縮和索引結(jié)構(gòu)的優(yōu)化,如使用位圖、倒排列表等數(shù)據(jù)結(jié)構(gòu)。
*以招聘場(chǎng)景舉例說(shuō)明倒排索引的應(yīng)用:求職者搜索特定職位時(shí),系統(tǒng)只需要在倒排索引中查找關(guān)鍵詞對(duì)應(yīng)的文檔ID列表,即可快速找到匹配的職位,無(wú)需掃描全部職位信息。
4. 意圖識(shí)別
1)意圖識(shí)別
我個(gè)人認(rèn)為,意圖識(shí)別就是在技術(shù)上區(qū)分搜索和推薦的核心不同點(diǎn)之一。當(dāng)用戶在搜索場(chǎng)景中輸入關(guān)鍵詞詞(query)時(shí),系統(tǒng)會(huì)對(duì)關(guān)鍵詞進(jìn)行“分詞-糾錯(cuò)-改寫(xiě)-意圖識(shí)別-輸出識(shí)別結(jié)果”這一系列操作,我們把這個(gè)過(guò)程統(tǒng)稱為意圖識(shí)別。
例如,在招聘平臺(tái)中,意圖識(shí)別意味著理解求職者是尋找特定職位、公司信息、工作場(chǎng)所、薪資還是其他相關(guān)內(nèi)容,基本知道了用戶在搜什么,然后根據(jù)這個(gè)意圖去推薦符合意圖的崗位。這里存放內(nèi)容信息的地方,就叫做索引。
2)分詞
分詞又叫切詞,是文本處理中的基礎(chǔ)步驟,切詞對(duì)于提高搜索效率和準(zhǔn)確率非常重要。切詞是將連續(xù)的文本分割成獨(dú)立且有語(yǔ)義的詞,這也是切詞的難點(diǎn):識(shí)別詞的邊界和歧義問(wèn)題。
切詞時(shí)先對(duì)文本進(jìn)行臟數(shù)據(jù)清洗和轉(zhuǎn)化(去除標(biāo)點(diǎn)、大小寫(xiě)轉(zhuǎn)換等),然后用平臺(tái)自有或市面上場(chǎng)景的詞典進(jìn)行文本匹配切詞,匹配成功就切詞。這里面涉及到詞典中沒(méi)有的和有歧義的詞,需要進(jìn)行算法切分或進(jìn)行詞性標(biāo)注進(jìn)行劃分,優(yōu)化詞典。
3)糾錯(cuò)
糾錯(cuò)是提升用戶體驗(yàn)和搜索效率的重要部分,尤其是在處理用戶輸入的關(guān)鍵詞時(shí),能夠有效的識(shí)別就糾錯(cuò),確保用戶能夠快速找到需要的內(nèi)容。
常見(jiàn)的糾錯(cuò)內(nèi)容有:拼寫(xiě)糾錯(cuò)、語(yǔ)法糾錯(cuò)、同音詞糾錯(cuò)、縮寫(xiě)糾錯(cuò)等。在用戶輸入搜索詞后,進(jìn)行初步處理(去掉空格、標(biāo)點(diǎn)等)后,利用詞典(專業(yè)詞庫(kù)或錯(cuò)誤詞典)對(duì)每個(gè)詞進(jìn)行匹配,且考慮關(guān)鍵詞的上下文信息,進(jìn)行糾錯(cuò)推斷。還能利用模型算法進(jìn)行糾錯(cuò)。通過(guò)自動(dòng)糾錯(cuò)的方式,提升搜索效率及搜索場(chǎng)景的包容性,進(jìn)一步提升用戶體驗(yàn)。
4)改寫(xiě)
改寫(xiě)是提升搜索質(zhì)量和用戶體驗(yàn)的關(guān)鍵過(guò)程之一。改寫(xiě)通過(guò)分析理解用戶的關(guān)鍵詞,進(jìn)行轉(zhuǎn)換,生成更精準(zhǔn)更符合自己平臺(tái)的查詢query,從而獲得更準(zhǔn)更多的搜索結(jié)果。
改寫(xiě)通過(guò)同義詞替換、拼寫(xiě)修正、短語(yǔ)識(shí)別與重組、去噪化數(shù)據(jù)、規(guī)范化數(shù)據(jù)等方面進(jìn)行搜索詞處理。在用戶輸入搜索詞后,進(jìn)行初步的分詞和去噪處理(去掉無(wú)意義詞),通過(guò)自然語(yǔ)言處理技術(shù)分析用戶查詢的意圖,包括關(guān)鍵詞分析、上下文理解等。根據(jù)已建立的改寫(xiě)規(guī)則庫(kù)(如同義詞表、拼寫(xiě)糾正規(guī)則等),匹配合適的改寫(xiě)方案。運(yùn)用機(jī)器學(xué)習(xí)模型,基于用戶行為數(shù)據(jù)和歷史搜索結(jié)果,動(dòng)態(tài)生成更精準(zhǔn)的改寫(xiě)建議。
改寫(xiě)能提升搜索結(jié)果相關(guān)性,有效處理長(zhǎng)尾查詢,拓寬用戶搜索范圍,增加內(nèi)容覆蓋度,促進(jìn)長(zhǎng)尾流量的轉(zhuǎn)化。
*意圖識(shí)別引導(dǎo)整個(gè)搜索過(guò)程,決定是否需要改寫(xiě);改寫(xiě)優(yōu)化查詢以提高相關(guān)性;切詞和分詞提供基本處理單元;詞典和詞庫(kù)提供詞匯規(guī)范和專業(yè)匹配依據(jù),共同確保搜索的高效和準(zhǔn)確。
三、搜索場(chǎng)景核心流程
關(guān)于搜索場(chǎng)景的召回、排序等介紹,大家感興趣的可以看之前的介紹:http://www.codemsi.com/pd/4519608.html
四、制定搜索場(chǎng)景優(yōu)化目標(biāo)
1. 定義搜索場(chǎng)景及用戶需求
1)用戶群體:需要明確平臺(tái)的主要用戶群體,如求職者、雇主客戶、代招(獵頭)等,并分析他們的特定需求。
2)搜索場(chǎng)景:識(shí)別用戶在什么情境下使用搜索功能,如求職者尋找特定職位、雇主客戶篩選候選人、獵頭尋求合適人才等。
2. 確定優(yōu)化目標(biāo)
其實(shí)在第二部分中就已經(jīng)提到了搜索場(chǎng)景中各模塊的核心目標(biāo):讓用戶在搜索場(chǎng)景快速找到精確目標(biāo)內(nèi)容,提升轉(zhuǎn)化和用戶體驗(yàn)。因此,搜索場(chǎng)景的整體優(yōu)化目標(biāo),其實(shí)就是快速識(shí)別用戶意圖、進(jìn)行精準(zhǔn)推薦,并讓用戶快速完成轉(zhuǎn)化。
- 提升用戶體驗(yàn):減少搜索響應(yīng)時(shí)間,優(yōu)化搜索結(jié)果的相關(guān)性和多樣性,提供個(gè)性化推薦。
- 增加用戶參與度:提升搜索后的行為轉(zhuǎn)化率(如點(diǎn)擊、申請(qǐng)職位、收藏、投遞簡(jiǎn)歷等),延長(zhǎng)用戶在平臺(tái)的停留時(shí)間。
- 業(yè)務(wù)目標(biāo):提高職位匹配效率,增加有效連接(求職者與雇主的配對(duì)),提升用戶滿意度和留存率,最終推動(dòng)業(yè)務(wù)增長(zhǎng)。
3. 設(shè)定目標(biāo)提升量
根據(jù)核心目標(biāo),我們制定了對(duì)應(yīng)的量化指標(biāo):各公司的優(yōu)化方向略有差異,但整體思路大同小異,搜索場(chǎng)景的優(yōu)化目標(biāo)對(duì)比下來(lái),基本上是以下4個(gè)方向指標(biāo)的提升:內(nèi)容的相關(guān)性提升、轉(zhuǎn)化漏斗中轉(zhuǎn)化指標(biāo)的提升(ctr-點(diǎn)擊率、cvr-轉(zhuǎn)化率、deep-cvr深度轉(zhuǎn)化等)、轉(zhuǎn)化數(shù)量絕對(duì)值的提升、用戶滿意度;
量化指標(biāo)的確定以后,需要確定量化目標(biāo)值,例如轉(zhuǎn)化量提升10%。這個(gè)10%是怎么來(lái)的?不能摸著腦袋直接拍數(shù)據(jù),需要多角度進(jìn)行合理預(yù)估:
- 基準(zhǔn)線分析:當(dāng)前搜索場(chǎng)景的用戶量、轉(zhuǎn)化率、轉(zhuǎn)化量數(shù)據(jù);對(duì)比各周期數(shù)據(jù)漲幅趨勢(shì);
- 上限預(yù)估:根據(jù)競(jìng)品分析、平臺(tái)往年數(shù)據(jù)對(duì)比、轉(zhuǎn)化漏斗拆分,預(yù)估用戶量上限和轉(zhuǎn)化指標(biāo)上限;
- 快速驗(yàn)證:在正式實(shí)施前,通過(guò)A/B測(cè)試或小范圍試驗(yàn)新策略,收集數(shù)據(jù)以量化預(yù)期提升效果。
- 風(fēng)險(xiǎn)評(píng)估:評(píng)估實(shí)施計(jì)劃所需的時(shí)間、人力、技術(shù)資源以及潛在風(fēng)險(xiǎn),確保目標(biāo)設(shè)定在資源可承受范圍內(nèi),同時(shí)考慮到可能遇到的阻力和不確定性。
*最近預(yù)估的10%轉(zhuǎn)化率提升是基于上述多維度分析的結(jié)果,是一個(gè)結(jié)合了歷史數(shù)據(jù)、行業(yè)標(biāo)準(zhǔn)、技術(shù)可行性及資源評(píng)估的綜合預(yù)判。實(shí)際操作中,這一目標(biāo)應(yīng)當(dāng)是靈活調(diào)整的,并隨著項(xiàng)目進(jìn)展不斷校驗(yàn)和優(yōu)化。
五、搜索優(yōu)化方向
優(yōu)化目標(biāo)相關(guān)指標(biāo)思考清楚后,整個(gè)場(chǎng)景的優(yōu)化目標(biāo)值就很清晰了,這部分主要根據(jù)我在工作中遇到的問(wèn)題匯總后劃分了以下4個(gè)方向去優(yōu)化:
1. 用戶覆蓋率(c端產(chǎn)品體驗(yàn)+策略優(yōu)化)
這部分主要是針對(duì)功能模塊的優(yōu)化,去合理提升用戶在各模塊的覆蓋率以及用戶在搜索場(chǎng)景的轉(zhuǎn)化路徑;
需要看的數(shù)據(jù)主要有:
1)整個(gè)轉(zhuǎn)化流程中用戶的轉(zhuǎn)化漏斗(請(qǐng)求-下發(fā)-曝光-點(diǎn)擊-轉(zhuǎn)化-深度轉(zhuǎn)化),去看用戶在哪一塊的流失率最高,進(jìn)行歸因分析
2)提升點(diǎn)擊數(shù)量常用的策略:擴(kuò)大曝光量及吸引用戶眼球(加角標(biāo)或創(chuàng)意提示)
3)去掉多余的功能及轉(zhuǎn)化路徑(差異化推薦)
從用戶點(diǎn)擊搜索框-歷史搜索詞/熱門(mén)搜索列表-聯(lián)想詞-搜索結(jié)果頁(yè)/結(jié)果頁(yè)的結(jié)構(gòu)組成/展現(xiàn)形式等,進(jìn)行體驗(yàn)端問(wèn)題匯總,以優(yōu)化核心價(jià)值為目標(biāo),去做匯總;
2. 檢索流程及背后邏輯
匯總搜索場(chǎng)景線上流程并梳理對(duì)應(yīng)的檢索邏輯,如上面第二節(jié)講的搜索場(chǎng)景核心流程,根據(jù)核心流程拆分成以下優(yōu)化邏輯:
1)用戶點(diǎn)擊搜索框-點(diǎn)擊歷史搜索/點(diǎn)擊搜索按鈕/點(diǎn)擊熱門(mén)搜索/點(diǎn)擊聯(lián)想詞-請(qǐng)求列表頁(yè)(召回-排序-打散)
2)明確搜索場(chǎng)景目前線上檢索流程及對(duì)應(yīng)的背后邏輯,梳理完后,針對(duì)不同流程的邏輯進(jìn)行優(yōu)化,對(duì)接不同的技術(shù)團(tuán)隊(duì)
3)從整體體驗(yàn)端流程(用戶點(diǎn)擊搜索框–>用戶在搜索場(chǎng)景完成深度轉(zhuǎn)化)的每一個(gè)階段,對(duì)應(yīng)到底層的邏輯鏈路,去做相應(yīng)的梳理和建設(shè),整體的流程按照串聯(lián)點(diǎn)去做;
3. 內(nèi)容優(yōu)化
相關(guān)內(nèi)容體驗(yàn)及線上客訴融合,針對(duì)內(nèi)容出不來(lái)、出來(lái)的內(nèi)容不合理、內(nèi)容排序排不出上去、無(wú)法精準(zhǔn)搜索等問(wèn)題,細(xì)化挖掘底層原因,進(jìn)行優(yōu)化方案輸出;
*我在工作中常見(jiàn)的底層原因主要是意圖識(shí)別不準(zhǔn)確、分詞過(guò)細(xì)、標(biāo)簽召回有誤等,供參考。
4. 數(shù)據(jù)側(cè)要點(diǎn)
數(shù)據(jù)完整度決定了場(chǎng)景優(yōu)化的上限,在搜索場(chǎng)景優(yōu)化或正常的策略優(yōu)化中,都需要優(yōu)先做數(shù)據(jù)測(cè)算,以下是我在搜索場(chǎng)景優(yōu)化中匯總的數(shù)據(jù)側(cè)需要注意的地方:
1)埋點(diǎn)梳理
- 搜索場(chǎng)景常見(jiàn)指標(biāo)是否有對(duì)應(yīng)的埋點(diǎn)或日志表數(shù)據(jù)
- 轉(zhuǎn)化漏斗數(shù)據(jù)鏈路是否完整
2)數(shù)據(jù)看板
- 整體轉(zhuǎn)化漏斗看板/分請(qǐng)求來(lái)源看轉(zhuǎn)化漏斗看板
- 人均指標(biāo)看版
3)搜索詞監(jiān)控
- 針對(duì)頭部搜索詞對(duì)比,檢測(cè)頭部搜索詞是否異常,以及當(dāng)天新出現(xiàn)在頭部的搜索詞(及昨天對(duì)應(yīng)為top位置)
- 搜索詞接信安、風(fēng)控等過(guò)濾接口
4)優(yōu)化路徑匯總
數(shù)據(jù)摸底,輸出結(jié)論及問(wèn)題規(guī)劃。
前期需要對(duì)現(xiàn)有搜索場(chǎng)景進(jìn)行快速的數(shù)據(jù)摸底工作,從數(shù)據(jù)維度確認(rèn)gap在哪,主要有以下幾個(gè)維度的數(shù)據(jù)摸底:
場(chǎng)景與大盤(pán)數(shù)據(jù):
- 場(chǎng)景流量數(shù)據(jù)
- 分流程uv/pv轉(zhuǎn)化率
- 留存數(shù)據(jù)(對(duì)比大盤(pán))
場(chǎng)景頁(yè)面轉(zhuǎn)化數(shù)據(jù):
- 轉(zhuǎn)化率
- 分位置轉(zhuǎn)化數(shù)據(jù)
頭部搜索詞數(shù)據(jù):
- top1000/3000/5000/N搜索詞曝光占比
- 天/周/月搜索詞重合度
- 高曝光高轉(zhuǎn)化搜索詞
- 高曝光低轉(zhuǎn)化搜索詞
長(zhǎng)短期搜索詞監(jiān)測(cè)和數(shù)據(jù)看板建設(shè);
搜索詞監(jiān)測(cè):
- 搜索場(chǎng)景核心指標(biāo)監(jiān)測(cè)
- 突發(fā)熱詞監(jiān)測(cè)
- 頭部熱詞轉(zhuǎn)化率監(jiān)測(cè)(高曝光高轉(zhuǎn)化/高曝光低轉(zhuǎn)化,出發(fā)預(yù)警)
數(shù)據(jù)看板:
- 整體轉(zhuǎn)化漏斗
- 分召回策略轉(zhuǎn)化漏斗
六、其他關(guān)注點(diǎn)
1. 優(yōu)化前對(duì)齊搜索場(chǎng)景項(xiàng)目?jī)?yōu)化目標(biāo)及限制條件(商業(yè)收入與連接量的平衡點(diǎn))或其他訴求(商業(yè)流量占比與商業(yè)收入的關(guān)系)。
2. 明確各流程/各部門(mén)接口人,避免單個(gè)部分多人來(lái)回溝通;需求溝通明確時(shí)間節(jié)點(diǎn)。
3. 以項(xiàng)目形式進(jìn)行推進(jìn),避免單個(gè)需求來(lái)回溝通,浪費(fèi)技術(shù)資源。
4. 數(shù)據(jù)先行,埋點(diǎn)的制定及ab分流的策略等。
5. 抓住重點(diǎn),看數(shù)據(jù)在核心不在多,不能哐一下搞一堆數(shù)據(jù)出來(lái),沒(méi)有核心點(diǎn)。
本文由 @大俗大雅 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
感謝前輩指點(diǎn)!幫大忙了
寫(xiě)的很細(xì)致,基本與我現(xiàn)在的工作一致。