搜索聯(lián)想詞產(chǎn)品實(shí)踐系列之淺見(二)排序-場景動線篇

0 評論 7845 瀏覽 47 收藏 8 分鐘

編輯導(dǎo)語:在前一篇中,作者分享了關(guān)于《搜索聯(lián)想詞的產(chǎn)品定位,效果評估和召回》,本篇闡述在召回所有候選結(jié)果后,如何進(jìn)行排序的問題和聯(lián)想詞頁面的場景和動線,我們一起來了解一下。

一、候選詞條的精排

根據(jù)用戶確定的字符,在召回環(huán)節(jié)召回前K條候選聯(lián)想詞,如何將這些詞條精準(zhǔn)排序,就是排序需要解決的問題。在精排環(huán)節(jié),根據(jù)業(yè)務(wù)發(fā)展的成熟度,逐步從單一因子排序過度到多因子排序。

為什么要逐步過渡呢?主要是考慮到數(shù)據(jù)積累的量級影響到數(shù)據(jù)的信任度問題。在業(yè)務(wù)發(fā)展初期,數(shù)據(jù)量小,用戶交易鏈路后續(xù)數(shù)據(jù)對結(jié)果的影響抖動大,就單純采用交易環(huán)節(jié)前期行為,比如采用單純的點(diǎn)擊量因子來排序。

根據(jù)鏈路衰減原則,在業(yè)務(wù)發(fā)展初期,本身數(shù)據(jù)量都很小,后續(xù)的點(diǎn)擊,訂單,GMV就更小,如果采用后端的行為,那么對結(jié)果的擾動就非常大,也就是說這些數(shù)據(jù)對評估目標(biāo)是不可信任的。

等業(yè)務(wù)積累到一定階段,點(diǎn)擊率數(shù)據(jù)可被信任的話,可以采用點(diǎn)擊率數(shù)據(jù)來排序,等到業(yè)務(wù)發(fā)展相對成熟,可以采用包含人氣因子、收益因子、服務(wù)因子等綜合模型來排序。

排序產(chǎn)品策略主要有如下幾類,我將每種策略的優(yōu)劣做簡單分析,在闡明策略之前,我們還是將聯(lián)想詞目標(biāo)重申一下:

  • 用戶輸入部分字符就推薦出用戶需要的Query供用戶選擇,降低輸入成本;
  • 結(jié)合公司經(jīng)營需要或者用戶的發(fā)散性要求,提升推薦Query的新穎性。

策略1:基于推薦Query搜索次數(shù)排序,優(yōu)勢:簡單;不足:作弊Query可能被推出,并且長尾query沒機(jī)會。

策略2:基于Query靜態(tài)分的下拉推薦

Query靜態(tài)分?jǐn)M合了Query各維度的知識:比如Query PV、IPV、UV、IUV、CTR、成交轉(zhuǎn)化率、成交筆數(shù)、成交金額、召回商品數(shù),將上述知識用LR回歸的方法擬合成一個實(shí)數(shù)。

優(yōu)勢:根據(jù)靜態(tài)分對候選Query進(jìn)行排序,Query靜態(tài)分不僅考慮了Query的歷史PV/點(diǎn)擊信息,而且考慮了Query的交易信息,交易良好的Query獲得更多的展現(xiàn)機(jī)會,給予高質(zhì)量候選Query以更多的展現(xiàn)機(jī)會和排序位置,大大降低了低質(zhì)量和作弊Query的展現(xiàn)概率。

劣勢:靜態(tài)分主要依賴于歷史Query自身的特征,搜索Query與候選Query之間的聯(lián)系僅僅是兩者的前綴相同,這種簡單的共性(匹配)沒有將搜索Query與候選Query緊密的結(jié)合在一起,關(guān)聯(lián)性弱的候選Query如果行為表現(xiàn)比較好,就會排在前面,但是這種關(guān)聯(lián)性弱的Query的線上表現(xiàn),尤其是CTR往往很差。

策略3:基于CTR預(yù)估的下拉推薦

利用LR回歸模型來預(yù)估推薦Query的CTR,在模型中充分考慮到搜索Query和候選Query之間的關(guān)系,二者之間的聯(lián)系越強(qiáng),候選CTR就會高,反之則會比較低,所以設(shè)計的策略用到的特征如下

  • 搜索詞與推薦Query文本特征
  • 搜索詞與推薦Query的類目相關(guān)特征
  • 搜索(推薦)Query的詞性特征
  • 搜索(推薦)詞對應(yīng)的結(jié)果頁面特征
  • 候選Query靜態(tài)分特征(容納靜態(tài)分策略優(yōu)點(diǎn))

優(yōu)點(diǎn):充分考慮到推薦Query的歷史表現(xiàn),推薦Query與搜索Query之間的關(guān)系

缺點(diǎn):沒有考慮用戶的個性化偏好

策略4:結(jié)合用戶個性化建模的CTR下拉推薦

策略3考慮了搜索Query和候選Query之間關(guān)系以及候選Query的歷史表現(xiàn),但是沒有結(jié)合用戶個性化信息。

將用戶的年齡、性別、購買力、短期和長期Query偏好作為用戶建模,在排序時候結(jié)合個性化建模推薦會取得更好的效果,在策略3的基礎(chǔ)上增加如下用戶特征:

  • 用戶年齡
  • 用戶平臺性別
  • 用戶購買力
  • 用戶長期Query特征
  • 用戶短期Query特征

優(yōu)點(diǎn)就不用講了,但是策略4只有在平臺業(yè)務(wù)成熟度足夠的時候,才可能開展,同時對平臺研發(fā)能力有較高要求,具備用戶建模、行為建模等大數(shù)據(jù)平臺能力。

排序后處理:

  • 后處理包括同義Query去重;Query結(jié)構(gòu)化和合并。去重是指語義上相同,但是表層字符上有些不同,進(jìn)行詞條合并。
  • Query結(jié)構(gòu)化和合并:結(jié)構(gòu)化合并有助于展示更多的推薦(也就是聯(lián)想)Query。

比如在電商網(wǎng)站搜索“海爾”,推薦的Query有:

  • 海爾冰箱
  • 海爾洗衣機(jī)
  • 海爾風(fēng)扇
  • 海爾微波爐

一般地,網(wǎng)站將最常用Query能結(jié)構(gòu)化的盡量結(jié)構(gòu)化,結(jié)構(gòu)化遵循語義一致的原則,比如電商網(wǎng)站將品牌的多個品類(品類語義),品牌+品類的多種功能(功能語義)等結(jié)構(gòu)化在一起。

搜索聯(lián)想詞產(chǎn)品實(shí)踐系列之淺見(二)排序-場景動線篇

二、場景和動線

前面文章我們在搜索結(jié)果頁搭建場景和策劃動線,文中也提及在各個頁面都可以策劃場景和動線,比如在聯(lián)想詞頁面,電商網(wǎng)站策劃了店鋪導(dǎo)流的場景(上圖中藍(lán)色方框內(nèi)),滿足用戶直接搜索店鋪的需求,另外,策劃了O2O場景(上圖中的綠色方框),滿足用戶線下店鋪極速達(dá)的需求。

大家可能會問,這種場景穿插放置位置是如何決定的?這種場景策劃結(jié)合了商業(yè)變現(xiàn)和用戶需求,根據(jù)公司變現(xiàn)規(guī)則來確定,按照變現(xiàn)收入來確定位置。

搜索聯(lián)想詞產(chǎn)品實(shí)踐系列之淺見(二)排序-場景動線篇

Query離線處理:

Query歸一化:大小寫、全半角、簡繁體、無效字符比如停用詞、無效空格等。

大家對文中的產(chǎn)品策略,以及場景和動線設(shè)計,以及搜索聯(lián)想詞還有哪些方面的意見和建議,歡迎評論區(qū)留言討論。

#專欄作家#

毛新年,公眾號:資深電商專家毛新年,人人都是產(chǎn)品經(jīng)理專欄作家。起點(diǎn)學(xué)院講師,2021年B端產(chǎn)品經(jīng)理大會演講嘉賓。主導(dǎo)搭建主流電商平臺搜索推薦商品三大體系,熟悉電商平臺策略-產(chǎn)品-運(yùn)營-數(shù)據(jù)及研發(fā)各環(huán)節(jié)。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!