電商運(yùn)營(yíng)之站內(nèi)搜索全面指南(六)
本文作者從具體的工作實(shí)踐出發(fā),結(jié)合案例等分享了非常實(shí)用的大范圍排序中的類目預(yù)測(cè)知識(shí),供大家一同參考和學(xué)習(xí)。
在上一章節(jié)中,給大家簡(jiǎn)要的介紹了下搜索的具體流程,從輸入關(guān)鍵詞點(diǎn)擊搜索按鈕那一刻起,到搜索結(jié)果頁(yè)呈現(xiàn)給用戶的眨眼間,是經(jīng)過(guò)了怎樣的步驟和流程才呈現(xiàn)到我們面前。
其中有一些步驟我覺(jué)得可以深入講解一下,但是睡了一覺(jué)后,覺(jué)得可能對(duì)于產(chǎn)品運(yùn)營(yíng)的讀者你們有點(diǎn)過(guò)于晦澀和枯燥,即便知道了其中的奧妙對(duì)你們未來(lái)的運(yùn)營(yíng)工作也沒(méi)有太大的幫助比如分詞算法。
因此為了節(jié)省大家的時(shí)間,我還是挑重點(diǎn)說(shuō),本章就著重講解一下大范圍排序中的類目預(yù)測(cè)環(huán)節(jié)。以及結(jié)合我現(xiàn)在所在的單位起初的一些沙雕的操作,也順帶給各位立志想進(jìn)入產(chǎn)品圈的小年輕一些產(chǎn)品設(shè)計(jì)以及溝通中的建議,方法論什么的我就不想說(shuō)了,太虛,就直接上操作吧。
類目預(yù)測(cè)
什么叫類目預(yù)測(cè)?舉個(gè)簡(jiǎn)單的例子吧。如果輸入關(guān)鍵詞“手機(jī)”排在前面出來(lái)的是手機(jī)類目而不是手機(jī)殼類目,這就是類目預(yù)測(cè)。
根據(jù)搜索全詞匹配的原則,只要商品標(biāo)題或者屬性或者類目名稱等帶有“手機(jī)”關(guān)鍵詞的商品,都會(huì)被召回,而類目預(yù)測(cè)的作用就是將這些已經(jīng)召回的商品按照類目?jī)?yōu)先級(jí)進(jìn)行排序的過(guò)程。
說(shuō)起來(lái)簡(jiǎn)單,做起來(lái)就老費(fèi)勁了!如果僅僅從營(yíng)銷數(shù)據(jù)來(lái)進(jìn)行排序,手機(jī)殼單價(jià)低,商品數(shù)量眾多,相比于手機(jī)類目 單價(jià)高,數(shù)量可能遠(yuǎn)遠(yuǎn)不及配件。
那么如果我是個(gè)沒(méi)有感情的排序機(jī)器,我應(yīng)該優(yōu)先排哪個(gè)呢?
肯定是手機(jī)殼在最前面,因?yàn)槭謾C(jī)殼類目全方位的數(shù)據(jù)都比手機(jī)類目要好,為什么不排手機(jī)殼呢?很有道理。但是從消費(fèi)者意圖來(lái)講,用戶要的是手機(jī),不是手機(jī)殼,你這個(gè)數(shù)據(jù)再好看,對(duì)于消費(fèi)者肯定也是不準(zhǔn)的。
所以對(duì)于消費(fèi)者來(lái)說(shuō),類目預(yù)測(cè)的效果如何,是衡量搜索準(zhǔn)確性的入門指標(biāo)。由于目前國(guó)內(nèi)的電商巨頭都已經(jīng)通過(guò)了前期的人工收集,機(jī)器算法輔助階段,亦或已經(jīng)通過(guò)第三方的搜索解決方案提供商能夠提供比較完備的預(yù)測(cè)算法和方案。
那么此篇文章針對(duì)那些初創(chuàng),或者對(duì)搜索結(jié)果頁(yè)還不甚滿意且有至于自己優(yōu)化的企業(yè)有參考意義。(我將在最后一期給大家介紹一下,如何搭建一個(gè)比較完備且經(jīng)濟(jì)的站內(nèi)搜索產(chǎn)品方案)
類目預(yù)測(cè)我們分為兩部分講解,人工和機(jī)器算法
人工
很簡(jiǎn)單,直接在產(chǎn)品后臺(tái)搭建一個(gè)關(guān)鍵詞和類目的關(guān)聯(lián)表。做這個(gè)產(chǎn)品時(shí),產(chǎn)品經(jīng)理需要注意的問(wèn)題點(diǎn)有如下幾個(gè):
(1)該產(chǎn)品面向的使用用戶是誰(shuí)?肯定是搜索運(yùn)營(yíng)人員。首先要滿足的是用戶的使用方便,可以批量導(dǎo)入和導(dǎo)出功能,增刪改查一個(gè)都不能少。
(2)該產(chǎn)品運(yùn)營(yíng)的主要內(nèi)容是什么?關(guān)鍵詞,因此對(duì)于關(guān)鍵詞我們要區(qū)分語(yǔ)言,如果app涉及到多個(gè)語(yǔ)言區(qū)國(guó)家,因此就要分開(kāi)運(yùn)營(yíng),而且不同語(yǔ)言之間的互通生效;且對(duì)于音型文字需要對(duì)多種時(shí)態(tài)變體,以及同義詞生效。
同樣的關(guān)鍵詞,互換位置后也一樣生效,比如“手機(jī)蘋果”和“蘋果手機(jī)”等。這樣可以減少人工維護(hù)的詞量。(我現(xiàn)在所在的單位依舊采用的是絕對(duì)匹配的邏輯,這個(gè)坑依舊沒(méi)有填。這個(gè)也給了我一個(gè)啟示,做產(chǎn)品規(guī)劃時(shí)一定要先期做好細(xì)節(jié)處理,雖說(shuō)不用100%的面面俱到,但是最起碼的主要矛盾還是要考慮的)
(3)精確全詞匹配還是以中心詞匹配,一直是我入職以來(lái)的爭(zhēng)論,從一個(gè)站內(nèi)搜索體系搭建以來(lái),人工全詞匹配一直是領(lǐng)導(dǎo)層最相中的。因?yàn)槟軌蚋斐龀煽?jī),只需要幾個(gè)人 每天對(duì)著top詞來(lái)維護(hù)一遍就能達(dá)到數(shù)據(jù)提升的效果。
①精確全詞匹配預(yù)測(cè)
什么叫精確全詞匹配預(yù)測(cè),就是我搜索“蘋果手機(jī)128g”如果在人工維護(hù)的詞庫(kù)里只有“蘋果手機(jī)”這個(gè)詞,一樣是無(wú)法命中人工類目預(yù)測(cè),因此人工維護(hù)的全詞匹配的詞量是極其巨大的。
而且用戶輸入的關(guān)鍵詞是沒(méi)有規(guī)律可循的,什么樣的順序都無(wú)法預(yù)測(cè),因此詞功能只能作為快速修補(bǔ)關(guān)鍵詞呈現(xiàn)bug的功能。
②中心詞匹配預(yù)測(cè)
那什么叫中心詞匹配預(yù)測(cè),這個(gè)其實(shí)是基于一個(gè)合理的假設(shè),即電商網(wǎng)站是來(lái)購(gòu)物的,用戶進(jìn)行app瀏覽和搜索都是基于某種物品或者品牌需求,那么我們有理由相信只需要收集有限物品詞以及品牌詞就能涵蓋絕大部分搜索類目預(yù)測(cè)需求,那么這些物品詞或者品牌詞就是我們的中心詞。
比如用戶搜索“手機(jī)128g”那么“手機(jī)”就是中心詞,人工的中心詞詞庫(kù)只需要維護(hù)“手機(jī)”對(duì)應(yīng)前端/后端類目就能起到類目預(yù)測(cè)的效果,以點(diǎn)帶面會(huì)取得不錯(cuò)的效果。
也許有人會(huì)說(shuō),如果用戶輸入“手機(jī)殼”不也是預(yù)測(cè)到手機(jī)類目了么,也是預(yù)測(cè)錯(cuò)了。因此在此需要引入n-gram的策略,一般而言詞組優(yōu)先級(jí)要高于單詞。也就是說(shuō)詞庫(kù)是優(yōu)先匹配詞比較長(zhǎng)的,如果詞長(zhǎng)的沒(méi)有,再去匹配詞短的。
類目預(yù)測(cè)的邏輯是,某個(gè)關(guān)鍵詞只要通過(guò)算法或者人工預(yù)測(cè)到了類目,則會(huì)在預(yù)測(cè)的類目?jī)?yōu)先進(jìn)行and查詢并召回排序,然后在非預(yù)測(cè)類目and查詢并召回排序。
也就是說(shuō)如果在預(yù)測(cè)的類目里如果搜索不到產(chǎn)品,這個(gè)預(yù)測(cè)也沒(méi)啥用?;蛘哒f(shuō)是預(yù)測(cè)錯(cuò)類目。(當(dāng)然也有例外,當(dāng)一個(gè)用戶搜了一個(gè)特別刁鉆的詞“蘋果土豪金128g送給媽媽的禮物”算法或者人工預(yù)測(cè)到的類目是手機(jī)類目,但是and查詢?cè)谠擃惸繜o(wú)結(jié)果,此時(shí)可以采用減詞算法進(jìn)行智能減詞,提取關(guān)鍵詞主干供用戶選擇)。
機(jī)器算法
所謂機(jī)器算法是根據(jù)用戶的行為數(shù)據(jù)以及商品本身的固有信息得來(lái)的。
那么采用機(jī)器算法的邏輯基于詞頻和用戶的點(diǎn)擊行為基于貝葉斯理論(百度的意思就是:如果你看到一個(gè)人總是做一些好事,則那個(gè)人多半會(huì)是一個(gè)好人。這就是說(shuō),當(dāng)你不能準(zhǔn)確知悉一個(gè)事物的本質(zhì)時(shí),你可以依靠與事物特定本質(zhì)相關(guān)的事件出現(xiàn)的多少去判斷其本質(zhì)屬性的概率。 用數(shù)學(xué)語(yǔ)言表達(dá)就是:支持某項(xiàng)屬性的事件發(fā)生得愈多,則該屬性成立的可能性就愈大)。
貝葉斯算法需要有一定的數(shù)據(jù)訓(xùn)練集,而這些數(shù)據(jù)訓(xùn)練集是需要商品數(shù)據(jù)以及關(guān)鍵詞對(duì)應(yīng)的(關(guān)鍵詞與用戶點(diǎn)擊類目商品的概率)。
通過(guò)不斷的對(duì)訓(xùn)練集訓(xùn)練結(jié)果的優(yōu)化和評(píng)估,最后得出一個(gè)比較好的貝葉斯模型。這樣關(guān)鍵詞即與商品數(shù)據(jù)結(jié)合在一起,成了我們的機(jī)器類目預(yù)測(cè)。
然而類目預(yù)測(cè)的算法還有很多,這里只是給大家提一下,如果我把公式亮出來(lái)就顯得裝x了,因?yàn)槲乙部床欢?/p>
好了今天就到這吧。
預(yù)告下一期內(nèi)容,搜索算法的形成與原理。
#專欄作家#
作者:王歡,微信:wanghuan314400,運(yùn)營(yíng)小灰一枚。
本文由 @王歡 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,不得轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議
想問(wèn)下類目預(yù)測(cè)維護(hù)關(guān)鍵詞和前臺(tái)類目關(guān)聯(lián)還是后臺(tái)類目呢?以及維護(hù)幾級(jí)類目呢?
想問(wèn)下類目預(yù)測(cè)要做在結(jié)果商品排序前嗎 萬(wàn)一有其他類目的商品是運(yùn)營(yíng)想主推的商品怎么辦,是不是類目預(yù)測(cè)應(yīng)該和商品排序做在一起,只是把類目作為一個(gè)維度打分就好了,命中的類目加分,但最終還是和其他維度一起計(jì)算總分,用這個(gè)總分排商品的順序
這個(gè)沒(méi)有絕對(duì)的方案,類目預(yù)測(cè)是一個(gè)解決問(wèn)題得思路,如果有更為直接得方案實(shí)現(xiàn)了查準(zhǔn)也可以??梢砸徊讲絿L試。我目前實(shí)現(xiàn)的方案是在類目預(yù)測(cè)得基礎(chǔ)上進(jìn)行排序。而不是所有的類目一起排序打分。
不是很理解你舉的這個(gè)例子說(shuō)明的類目預(yù)測(cè)的復(fù)雜性,用戶搜索手機(jī),怎么可能會(huì)出現(xiàn)手機(jī)殼呢,商家在后臺(tái)上架時(shí)就有勾選該商品各級(jí)類目啊,當(dāng)用戶搜索手機(jī)時(shí),自動(dòng)檢索到手機(jī)類目下的商品不就可以了嗎
搜索是全局搜索,是文字匹配,不是類目下搜索,你搜游泳兩個(gè)字,怎么匹配類目呢,肯定是召回有游泳倆個(gè)字的商品標(biāo)題的所有商品,然后再預(yù)測(cè)類目
看你的文章總是覺(jué)得很安心,你總是可以調(diào)理清晰的,編寫出小白也能看懂的文字。正在悄悄看你寫的所有文章,加油,期待新作~!