數(shù)據(jù)中臺(tái)實(shí)戰(zhàn):基于標(biāo)簽的推薦系統(tǒng)必須要解決的4個(gè)核心問題
編輯導(dǎo)語:在推薦系統(tǒng)中,標(biāo)簽的使用可以讓定位更精準(zhǔn),提升匹配的水平和效率。那么,在業(yè)務(wù)過程中,我們應(yīng)當(dāng)采用哪種標(biāo)簽推薦方式?本篇文章里,作者結(jié)合實(shí)際經(jīng)驗(yàn),總結(jié)了如何利用數(shù)據(jù)中臺(tái)解決問題、搭建符合實(shí)際業(yè)務(wù)的標(biāo)簽推薦系統(tǒng),一起來看一下。
最近公司開了個(gè)新的產(chǎn)品線叫:圓猿買手,大家都知道我公司搭了一個(gè)B2B的女裝批發(fā)平臺(tái),主要服務(wù)的是全國做服裝批發(fā)生意的采購商、供應(yīng)商。圓猿買手這個(gè)產(chǎn)品是從B2B平臺(tái)獨(dú)立出來專門服務(wù)二批采購商的產(chǎn)品。
一、什么是二批采購商?
簡單來說就是大客戶,他們一般在二級(jí)的服裝批發(fā)市場(chǎng)如鄭州銀基等有自己的檔口,主要去一級(jí)的批發(fā)市場(chǎng)(一級(jí)的批發(fā)市場(chǎng)如廣州十三行、杭州四季清等)拿貨,拿完貨后銷售給自己的所在城市的終端門店或者三批采購商。
作為二批采購商,他們每次拿貨(采購)的量都是非常大的,因?yàn)槭俏覀兊拇罂蛻?,所以我司配備專門的買手給二批采購商提供一對(duì)一的推款、找款、發(fā)貨的服務(wù)。
買手是活躍在批發(fā)市場(chǎng)的一類角色,他們的核心競(jìng)爭力就是對(duì)市場(chǎng)的檔口、檔口的新款、爆款比較熟悉,而且他們是常駐在批發(fā)市場(chǎng)的,這樣二批采購商拿貨就不用每次都長途跑到一批市場(chǎng),只用和我們的買手溝通,就能拿到市場(chǎng)的新款、爆款。
為什么圓猿買手這個(gè)業(yè)務(wù)能夠存在?我覺得有2點(diǎn)原因。
第一由于買手的存在,大大降低了采購商的交易成本。
交易成本就是買賣雙方所付出的時(shí)間和金錢成本,交易類產(chǎn)品是否能夠存在,都可以用這個(gè)交易成本這個(gè)理論來衡量,交易成本理論是諾貝爾獎(jiǎng)獲得者科斯老爺子很多年前提出來的。
二批采購商一般都在二三線城市的批發(fā)市場(chǎng),每次跑到如廣州十三行這種一級(jí)批發(fā)市場(chǎng),來回都要很多的時(shí)間,路費(fèi)也是一筆不少的錢,有了買手的存在大大節(jié)省了他們的時(shí)間和錢。
第二買手的存在讓人貨匹配更加精準(zhǔn),這里的人是指二批采購商,貨是指一級(jí)批發(fā)市場(chǎng)的商品。
電商產(chǎn)品的創(chuàng)新很重要的一點(diǎn)就是提高人貨匹配的效率,我提供的商品剛好是你需要的,這樣買賣雙方付出的時(shí)間成本最低。
一個(gè)經(jīng)驗(yàn)豐富的服裝買手對(duì)市場(chǎng)中的檔口和檔口的新款、爆款都是非常熟悉的,而且由于買手長期和采購商溝通,這樣他會(huì)非常清楚當(dāng)前服務(wù)的這個(gè)采購商的偏好,這種情況下買手推的商品會(huì)更能命中二批采購商的口味。
由于買手的存在,交易模式從二批采購商到市場(chǎng)去找商品,到買手精準(zhǔn)的推給采購商大致符合他口味的商品,采購商從買手推的商品中挑一個(gè)商品就好了,這種模式好像搭建了一個(gè)人肉的推薦系統(tǒng)。
這篇文章我們談的是基于標(biāo)簽的推薦,那必定要解決以下幾個(gè)問題:
- 怎么給采購商和買手分別打上標(biāo)簽?
- 標(biāo)簽分為主觀標(biāo)簽和客觀標(biāo)簽,是用主觀的標(biāo)簽去做推薦,還是用客觀的標(biāo)簽去做推薦?
- 怎么通過標(biāo)簽完成采購商與買手的匹配過程?
- 基于標(biāo)簽的推薦具體的應(yīng)用場(chǎng)景有哪些?
二、怎么分別給采購商和買手打上標(biāo)簽
首先看一下數(shù)據(jù)情況,數(shù)據(jù)庫中有2類數(shù)據(jù),一個(gè)是埋點(diǎn)的數(shù)據(jù),一個(gè)是業(yè)務(wù)庫中的數(shù)據(jù)。埋點(diǎn)的數(shù)據(jù)記錄了采購商曾經(jīng)訪問了那個(gè)買手的那個(gè)商品,也就是采購商的訪問行為數(shù)據(jù)。
業(yè)務(wù)數(shù)據(jù)分為兩種,一種是采購商詢盤了買手的那個(gè)商品(B2B批發(fā)類的產(chǎn)品因?yàn)橛唵瘟看?,每次下單前,采購商和買手要確認(rèn)商品信息),另外一種是采購商支付了買手的那件商品。
通過這三類數(shù)據(jù)即可分別給買手和采購商打上相應(yīng)的偏好標(biāo)簽。因?yàn)闊o論是訪問、詢盤、下單,都是和商品綁定的,商品是有所屬店鋪、品類、風(fēng)格、價(jià)格段的屬性的,通過這些屬性就可以給采購商打上偏好的店鋪、品類、風(fēng)格、價(jià)格段的標(biāo)簽,同時(shí)也可以給買手打上擅長的店鋪、品類、風(fēng)格、價(jià)格段的標(biāo)簽。
比如某個(gè)采購商A只有2條數(shù)據(jù),分別是訪問了某個(gè)店鋪的商品B,詢盤了某個(gè)店鋪的商品C、下單了某個(gè)店鋪的商品D:
- 商品B是屬于店鋪1的商品,商品B的品類是牛仔褲,這個(gè)商品是買手1負(fù)責(zé);
- 商品C是屬于店鋪2的商品,商品C的品類是毛衣,這個(gè)商品的買手2負(fù)責(zé);
- 商品D是屬于店鋪3的商品,商品C的品類是T桖,這個(gè)商品也是買手1負(fù)責(zé)。
假設(shè)采購商訪問商品的權(quán)重是1分,詢盤3分,下單5分,那采購商A偏好的店鋪的排行就是店鋪3(5分)、店鋪2(3分)、店鋪1(1分),如果取分?jǐn)?shù)前2名的標(biāo)簽作為采購商的標(biāo)簽,那么采購商A偏好的店鋪就是店鋪3(5分)和店鋪2(3分),同樣的采購商A偏好的品類就是T桖(5分)、毛衣(3分)。
假設(shè)買手1和買手2也只有這幾條數(shù)據(jù),那么同樣可以給買手1和買手2打上同樣的標(biāo)簽。
- 買手1擅長的店鋪排名是:店鋪3(5分)、店鋪1(1)分。
- 買手2擅長的店鋪排名是:店鋪2(3分)。
- 買手1擅長的品類是:T桖(5分)、牛仔褲(1分)。
- 買手2擅長的品類是:毛衣(3分)。
三、標(biāo)簽分為主觀標(biāo)簽和客觀標(biāo)簽,應(yīng)該用哪種標(biāo)簽完成采購商與買手的推薦?
什么是主觀標(biāo)簽?主觀標(biāo)簽就是人為給采購商或者買手打上的標(biāo)簽,比如你通過采購商填的一些信息,給他打上了偏好牛仔褲的標(biāo)簽,或者這個(gè)采購商在注冊(cè)的時(shí)候自己填了自己喜歡牛仔褲這樣一個(gè)標(biāo)簽,這類的標(biāo)簽就是主觀標(biāo)簽,同樣的買手也可以打上相應(yīng)的主觀標(biāo)簽。
主觀標(biāo)簽的問題是標(biāo)簽不一定可信,比如剛才那個(gè)例子,他選了牛仔褲這個(gè)標(biāo)簽,但是他真的就喜歡牛仔褲嗎?每個(gè)人的興趣都是在不斷的變化的,誰也不能保證他這輩子都喜歡牛仔褲吧?
第一個(gè)問題中通過訪問、詢盤、下單數(shù)據(jù)給采購商和買手打上的標(biāo)簽就是客觀標(biāo)簽,是通過數(shù)據(jù)算出來的標(biāo)簽。
現(xiàn)在的問題是這兩類標(biāo)簽怎么結(jié)合完成采購商與買手的匹配,從數(shù)據(jù)層面來看,有些采購商同時(shí)有主觀標(biāo)簽和客觀標(biāo)簽,有些采購商只有主觀標(biāo)簽沒有客觀標(biāo)簽,還有些采購商只有客觀標(biāo)簽沒有主觀標(biāo)簽,買手的情況也是類似。
我們是采用單獨(dú)種類標(biāo)簽推薦的方式,還是混合標(biāo)簽推薦的方式呢?
單獨(dú)種類標(biāo)簽推薦的方式是指通過買手的主觀標(biāo)簽和采購商的主觀標(biāo)簽完成采購商與買手的匹配,同時(shí)通過買手的客觀標(biāo)簽和采購商的客觀標(biāo)簽完成采購商與買手的匹配,采用這種方式會(huì)產(chǎn)生2種推薦結(jié)果,最后需要把主客觀標(biāo)簽推薦的結(jié)果整合在一起,完成最終推薦結(jié)果的輸出。
混合標(biāo)簽推薦的方式是指無論采購商買手打上了主觀、客觀的標(biāo)簽,先做一層整合,保證采購商和買手分別只有一套標(biāo)簽,再通過這套標(biāo)簽完成采購商和買手的匹配,這種方式有2個(gè)問題:
- 怎么整合采購商的主客觀標(biāo)簽,保證采購商只有一套標(biāo)簽?
- 推薦系統(tǒng)上線后怎么判定那套標(biāo)簽的推薦效果更好?
很明顯單獨(dú)種類標(biāo)簽推薦的方式的推薦結(jié)果會(huì)更有優(yōu)勢(shì),前期可以分別上線主觀標(biāo)簽推薦和客觀標(biāo)簽推薦的結(jié)果進(jìn)行單獨(dú)測(cè)試,先驗(yàn)證那種方式的效果更好,后期可以給每種算法不同的權(quán)重,結(jié)合后給出最終的推薦結(jié)果。
比如通過主觀標(biāo)簽給用戶A推薦出來買手1、買手2,通過客觀標(biāo)簽給用戶A推薦出來買手2、買手3。
主觀標(biāo)簽算法的權(quán)重是1分,客觀標(biāo)簽算法的權(quán)重是3分,那么2種算法結(jié)合后給用戶A推薦出來的最終結(jié)果就是:買手2(4分)、買手3(3分)、買手1(1分)。
而混合標(biāo)簽推薦的方式,不僅不利于后期的效果數(shù)據(jù)分析,而且因?yàn)樘崆皩煞N標(biāo)簽做了結(jié)合,很難判定那種算法推薦出來的結(jié)果更精準(zhǔn)。
四、怎么通過標(biāo)簽完成采購商與買手的匹配過程,這也是標(biāo)簽推薦算法的核心
問題一中我們分別為采購商、買手打上了店鋪、品類的標(biāo)簽:
- 采購商A偏好的店鋪是店鋪3(5分)和店鋪2(3分);
- 采購商A偏好的品類是T桖(5分)、毛衣(3分);
- 買手1擅長的店鋪排名是:店鋪3(5分)、店鋪1(1)分;
- 買手2擅長的店鋪排名是:店鋪2(3分);
- 買手1擅長的品類是:T桖(5分)、牛仔褲(1分);
- 買手2擅長的品類是:毛衣(3分)。
第一種方式是不看標(biāo)簽的分?jǐn)?shù),只要采購商和買手的標(biāo)簽匹配上就計(jì)1分,先從店鋪的角度來看因?yàn)椴少徤藺偏好的店鋪是店鋪3和店鋪2,而買手1擅長店鋪3,買手2擅長店鋪2,買手1和買手2各得1分,再從品類來看因?yàn)椴少徤藺偏好T桖和毛衣,買手1擅長T桖,買手二擅長毛衣1,買手1和買手2也各得1分,這種方式的最終結(jié)果是:
- 采購商A與買手1的匹配分?jǐn)?shù)是2分;
- 采購商A與買手2的匹配分?jǐn)?shù)是2分。
這種算法雖然簡單,但是明顯有些問題,沒有考慮采購商和買手針對(duì)標(biāo)簽的得分,導(dǎo)致買手1,買手2的得分一致。
如果加入采購商與買手針對(duì)標(biāo)簽的得分:
- 在店鋪的維度買手1的得分是:5*5=25分,買手2的得分是3*3=9分;
- 在品類的維度買手1的得分是:5*5=25分,買手2的得分是3*3=9分。
這樣買手1的總分是50分,買手2的總分是18分,優(yōu)先推薦買手1給采購商A。
當(dāng)然還可以考慮給標(biāo)簽定義不同的權(quán)重,可以假設(shè)店鋪標(biāo)簽的權(quán)重是大于品類的,這種算法考慮的就更加全面,但也會(huì)更加復(fù)雜。做推薦這塊我們的追求應(yīng)該是簡單且有用,也就是說付出最低的成本,拿到最好的效果,從簡單到復(fù)雜、不斷優(yōu)化的過程。
五、基于標(biāo)簽的推薦具體的應(yīng)用場(chǎng)景有哪些
基于標(biāo)簽的推薦算法,最終一定要開放出去,用來服務(wù)采購商,但前期因?yàn)闊o法確定這套算法的效果,可以先開放給公司內(nèi)部運(yùn)營人員使用。
首先可以先開放查詢采購商/買手所打標(biāo)簽功能給熟悉業(yè)務(wù)的運(yùn)營人員,讓他們可以快速查看采購商/買手身上基于現(xiàn)有數(shù)據(jù)所打上的標(biāo)簽:
如果經(jīng)過驗(yàn)證,所打標(biāo)簽數(shù)據(jù)足夠準(zhǔn)確,那這些標(biāo)簽的數(shù)據(jù)也可以指導(dǎo)運(yùn)營人員針對(duì)采購商/買手做更加精細(xì)化的運(yùn)營,當(dāng)然也可以將采購商的標(biāo)簽開放到給他服務(wù)的買手,讓買手快速查看到他當(dāng)前所服務(wù)采購商的特點(diǎn),這樣可以做更加精準(zhǔn)的服裝推薦。
接著可以讓運(yùn)營人員提供一些典型的采購商/買手,將標(biāo)簽算法匹配的最終結(jié)果(采購商與買手的匹配率),交給運(yùn)營人員來驗(yàn)證。
如果基于標(biāo)簽的推薦匹配準(zhǔn)確率達(dá)到人工匹配水平或者超過人工匹配水平,就可以考慮將算法的結(jié)果開放出去服務(wù)真實(shí)的采購商。
實(shí)際項(xiàng)目中我們也是花了3個(gè)月的時(shí)間不斷驗(yàn)證和迭代,最后達(dá)到人工判斷超過80%的準(zhǔn)確率(隨機(jī)輸出10個(gè)采購商的推薦算法結(jié)果,其中有8位采購商的結(jié)果,以人的判斷是準(zhǔn)確的),才最終用到實(shí)際項(xiàng)目中:
最后留個(gè)小問題,比如你給一個(gè)采購商基于算法推薦出了一個(gè)合適的買手,但這個(gè)買手最近太忙了,實(shí)在不能抽身服務(wù)這個(gè)采購商,這個(gè)時(shí)候該怎么辦?歡迎留言討論。
#專欄作家#
Wilton董超華,微信公眾號(hào):改變世界的產(chǎn)品經(jīng)理,人人都是產(chǎn)品經(jīng)理專欄作家。暢銷書《數(shù)據(jù)中臺(tái)實(shí)戰(zhàn)》作者,曾任職科大訊飛,現(xiàn)任富力環(huán)球商品貿(mào)易港數(shù)據(jù)中臺(tái)產(chǎn)品負(fù)責(zé)人。主要分享商業(yè)、產(chǎn)品、運(yùn)營、數(shù)據(jù)中臺(tái)相關(guān)原創(chuàng)文章。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
點(diǎn)個(gè)贊。還能堅(jiān)持在人人上寫文章不容易,內(nèi)容還這么詳實(shí)有學(xué)習(xí)價(jià)值,更不容易。加油。
“最后留個(gè)小問題,比如你給一個(gè)采購商基于算法推薦出了一個(gè)合適的買手,但這個(gè)買手最近太忙了,實(shí)在不能抽身服務(wù)這個(gè)采購商,這個(gè)時(shí)候該怎么辦?歡迎留言討論。”—系統(tǒng)有買手的服務(wù)情況,把閑忙系數(shù)也作為標(biāo)簽,對(duì)么?
贊!