產(chǎn)品如何做到差異化?試試個性化推薦和數(shù)據(jù)挖掘
本文寫給想了解AI如何助力推薦系統(tǒng)的朋友,并對一些常見的推薦方式進(jìn)行梳理。
我們以往都強(qiáng)調(diào)需求,隨著過往移動互聯(lián)網(wǎng)時代已經(jīng)極大豐富了各種需求,您還能找到哪種大的需求場景沒被滿足的嗎?幾乎沒有這樣的需求空白機(jī)會。
所以新年里產(chǎn)品唯一的機(jī)會點(diǎn)是做到跟競品有差異化,怎么能做到差異化呢?即要比競品更懂用戶,給用戶更精準(zhǔn)的推薦,就是挖掘數(shù)據(jù)應(yīng)用數(shù)據(jù)來推薦。
本文寫給想了解AI如何助力推薦系統(tǒng)的朋友,并對一些常見的推薦方式進(jìn)行梳理。
4種主流的推薦方式
市場迄今為止,對推薦系統(tǒng)的分類并沒有統(tǒng)一的標(biāo)準(zhǔn),但根據(jù)對淘寶產(chǎn)品的了解其推薦方法基本包括如下幾種:基于內(nèi)容的推薦方式、協(xié)同過濾的方式、基于知識推薦、組合推薦。
下面對4種推薦方式進(jìn)行介紹。
第一種:基于內(nèi)容的推薦方式
基于內(nèi)容的推薦(Content-Based Recommendation)系統(tǒng)是建立在用戶以前的行為模式基礎(chǔ)上的。以前的行為就是標(biāo)簽值,推薦算法將產(chǎn)品分解為一系列標(biāo)簽,并根據(jù)用戶對產(chǎn)品的行為(例如:購買、瀏覽)將用戶屬性也描述為一系列標(biāo)簽。
如下圖:
該方式下的推薦系統(tǒng)為用戶提供包括用戶記錄中顯示偏好的一些信息,產(chǎn)品推薦并不是將用戶本身的喜好作為基礎(chǔ),而是以產(chǎn)品本身的信息作為基礎(chǔ)的。比如說:如果一個用戶對智能音箱比較感興趣,過去常常搜索和智能音箱相關(guān)的信息,那么該自動推薦系統(tǒng)會將與智能音箱相關(guān)的其他音箱直接推薦給他。
用戶的偏好通常作為一組文本標(biāo)簽,用于表示用戶喜好類型的個人資料。
淘寶搜索框就是一種應(yīng)用于表現(xiàn)和研究用戶喜好的技術(shù)。這種方法可以將未分級的產(chǎn)品優(yōu)先推薦給具有獨(dú)特興趣的用戶。并且以列表的功能將推薦的商品展現(xiàn)出來,還會對推薦的結(jié)果進(jìn)行解釋,這樣會無形中增加用戶對系統(tǒng)推薦商品的信心。
第二種:協(xié)同過濾的推薦方式
協(xié)同過濾推薦(Collaborative Filtering Recommendation)系統(tǒng)是根據(jù)其他用戶的選擇然后將一個商品推薦給用戶。但是商品的內(nèi)容不會被考慮到,也就是說,該方式下通過人對那個商品的判斷來進(jìn)行過濾。
對協(xié)同過濾最直白的說法是就是用戶不知道怎么選擇,大家來幫他選擇。
協(xié)同過濾對應(yīng)的算法分類是基于用戶的協(xié)同過濾算法和基于物品的協(xié)同過濾算法,基于用戶的協(xié)同過濾算法的關(guān)鍵是找到相同偏好的用戶。
第三種:基于知識的推薦方式
基于知識的推薦方式(Knowledge-Based ?Recommendation)可以被看做是一種推理(inference)技術(shù)。
它并不是建立在用戶偏好和需要的基礎(chǔ)上進(jìn)行的推薦,而是通過對特定領(lǐng)域定義規(guī)則的基礎(chǔ)上來進(jìn)行基于規(guī)則以及實(shí)例的推理(case-based reasoning)。
例如:通過對飯店的菜品方式的效用知識的推理,將飯店推薦給顧客。我們將某個對象如何去滿足某一特定用戶的知識稱為效用知識(function knowledge),所以它能夠解釋推薦和需求的關(guān)系,可以被用于推薦系統(tǒng)。效用知識必須以機(jī)器可讀的方式存在(ontology ?本體知識庫)于推薦系統(tǒng)中。
基于知識的推薦模型如下圖:
第四種:組合推薦的方式
組合推薦(Hybrid Recommendation)有一個重要原則,即它要求通過組合后能彌補(bǔ)和避免各種推薦技術(shù)所存在的缺點(diǎn)。
目前應(yīng)用最多的是協(xié)同過濾推薦和內(nèi)容推薦的組合,一般,盡管推薦組合的方法有很多種,然而不同的應(yīng)用場景需要不同的組合思路。
筆者根據(jù)淘寶的經(jīng)驗(yàn)具體的對產(chǎn)品運(yùn)營或者算法人員給出的組合思路大致的可以分為如下 3 類:
- 后融合:將大于等于兩種以上的推薦系統(tǒng)各自所產(chǎn)生的推薦結(jié)果進(jìn)行融合。比如:通過使用基于協(xié)同過濾的方法以及內(nèi)容的方法而得到推薦列表,對列表的結(jié)果進(jìn)行融合從而決定最后所推薦的對象。
- 中融合:將一種推薦方法作為框架,并融合另外的一種推薦方法。比如將協(xié)同過濾的方法作為框架,融合基于內(nèi)容的方法;或者將基于內(nèi)容的方法作為框架,融合協(xié)同過濾的方法。
- 前融合:直接對各種推薦方法進(jìn)行融合,如將基于協(xié)同過濾和基于內(nèi)容的方法整合到一個統(tǒng)一的框架模型下。
今天,新的年度里,寫滿了「數(shù)據(jù)」的字樣。單純流量的價值開始褪色,化作更加不言自明的基礎(chǔ)設(shè)施,而如何發(fā)掘數(shù)據(jù)價值、增強(qiáng)數(shù)據(jù)應(yīng)用,則成為了產(chǎn)品運(yùn)營的主色調(diào)——這也成為了產(chǎn)品運(yùn)營人員要想當(dāng)團(tuán)隊(duì)的領(lǐng)導(dǎo)角色必須懂?dāng)?shù)據(jù)挖掘的一般知識流程。
另外比競爭對手更懂用戶需要數(shù)據(jù)挖掘,在做推薦系統(tǒng)之前,也需要數(shù)據(jù)挖掘,下面我們介紹數(shù)據(jù)挖掘方面產(chǎn)品運(yùn)營應(yīng)該懂的點(diǎn)。
數(shù)據(jù)挖掘的過程是AI應(yīng)用的過程。因?yàn)閿?shù)據(jù)挖掘的過程是知識發(fā)現(xiàn)的過程,而知識發(fā)現(xiàn)是人工智能的一種典型應(yīng)用。
數(shù)據(jù)挖掘的方法:
數(shù)據(jù)挖掘的方法也就是從數(shù)據(jù)庫或其他數(shù)額特別巨大的海量信息儲存中提取出用戶感興趣的文本標(biāo)簽。
產(chǎn)品運(yùn)營人員不妨偶爾從技術(shù)角度方面來看一下數(shù)據(jù)挖掘,因?yàn)樗Y(jié)合了采集數(shù)據(jù)和登記分類數(shù)據(jù),接著,類規(guī)則的知識將從大量數(shù)據(jù)中被生成。
數(shù)據(jù)挖掘領(lǐng)域包括許多技術(shù),如:機(jī)器學(xué)習(xí)、統(tǒng)計、模式識別、模型庫、數(shù)據(jù)庫、可視化等技術(shù)。產(chǎn)品運(yùn)營懂這些技術(shù)的話一方面能夠從更多角度設(shè)計出差異化競品的產(chǎn)品方案,另外一方面能夠更方便的跟算法、代碼、模型、數(shù)據(jù)倉庫工程師等技術(shù)人員進(jìn)行交流。
通常情況下,數(shù)據(jù)挖掘的步驟如下圖所示:
產(chǎn)品運(yùn)營人員從知道數(shù)據(jù)挖掘的步驟流程以后,您在跟進(jìn)產(chǎn)品進(jìn)度和實(shí)現(xiàn)數(shù)據(jù)提供的業(yè)務(wù)支撐上能夠做到更加有信心使產(chǎn)品差異化競品!
上面講了數(shù)據(jù)挖掘的步驟,那么我們在從數(shù)據(jù)庫特點(diǎn)的角度出發(fā),幫我們的產(chǎn)品運(yùn)營人員介紹 8 個需要在數(shù)據(jù)挖掘過程中完成的任務(wù)。
任務(wù)一:產(chǎn)品運(yùn)營定義好分類(Classification)
分類是最常見的數(shù)據(jù)挖掘任務(wù)。
這個任務(wù)由兩部分組成:
- 第一部分是研究新近對象的特點(diǎn);
- 第二部分是,將它分配給一組預(yù)定義的類。
與此同時,分類有兩個主要的特點(diǎn):
- 特點(diǎn)一要求,要有一個定義明確的類;
- 特點(diǎn)二是,要有一個包括分類例子的訓(xùn)練集。
另外,還要構(gòu)建某種模型,用于將未分類的數(shù)據(jù)進(jìn)行分類。
第一步先將那些已經(jīng)分好類的訓(xùn)練集從數(shù)據(jù)中選出來,然后在該訓(xùn)練集上建立分類模型,該模型的建立需要運(yùn)用數(shù)據(jù)挖掘分類的技術(shù),對那些還未進(jìn)行分類的數(shù)據(jù)進(jìn)行分類。
例如:
- ?通常將信用卡申請者,分類為高、中、低風(fēng)險,
- ?然后用戶會被分配到預(yù)先定義好的用戶分片中。
注意:類的個數(shù)是預(yù)先定義好的并且是確定的。
任務(wù)二:出估值(Estimation)
估值是一種用來處理具有連續(xù)性預(yù)估結(jié)果的任務(wù)。 采用估值的目的是,基于一些輸入的數(shù)據(jù),為一些連續(xù)的、未知的變量,提供一個值。比如收入、信用卡節(jié)余、身高等等。
估值和分類比較接近,所不同的是,分類是對離散型變量的輸出的描述,但是估值卻用于對連續(xù)值的輸出的處理;分類的類別數(shù)目是確定的,估值的量是不確定的。
比如:
- ?通過購買行為,來評估一個家庭有多少個孩子;
- ?通過購買行為,來評估一個家庭的收入有多少;
- ?估計 real estate 的價值。
任務(wù)三:給出預(yù)測(Prediction)
通常情況下,預(yù)測是通過估值或分類起作用的,即通過估值或分類得出模型,然后該模型將被應(yīng)用于對未知變量來進(jìn)行預(yù)測。
預(yù)測的目的是對未來未知變量進(jìn)行預(yù)測,然而這種預(yù)測必須通過時間來進(jìn)行驗(yàn)證,也就是說必須等待一定的時間后,才能夠得出預(yù)測的準(zhǔn)確性是多少。
任務(wù)四:相關(guān)性分組或關(guān)聯(lián)分析(Affinity grouping or association rules)
關(guān)聯(lián)的任務(wù)是用來確定哪些產(chǎn)品應(yīng)該一起處理或者哪些事情將一起發(fā)生。
例如:假設(shè)某客戶在逛盒馬鮮生時,當(dāng)該客戶在購買澳龍時,與此同時也會購買多寶魚,即 A => B(關(guān)聯(lián)規(guī)則)。
除此之外,我們產(chǎn)品運(yùn)營人員應(yīng)該懂,它對產(chǎn)品運(yùn)營還有更深的用途,它可以應(yīng)用于鑒別交叉銷售機(jī)會和設(shè)計有吸引力的產(chǎn)品和服務(wù)的包裝或組合。 例如:下次可以計算出澳龍與波士頓龍蝦的文本相似度,然后當(dāng)波士頓龍蝦庫存較多時可以組合波士頓龍蝦與多寶魚組合起來賣。
任務(wù)五:序列模式(Sequential pattern)
序列化模式檢測事務(wù)之間的模式,在事務(wù)數(shù)據(jù)庫中,一段時間內(nèi)一組項(xiàng)目是跟在另一組項(xiàng)目的后面而存在的。
例如逛盒馬鮮生的時候,用戶在購買澳龍后,隔一段時間,會購買牛排。這有點(diǎn)類似于關(guān)聯(lián),但是,主要的不同點(diǎn)是序列模式展現(xiàn)出了不同產(chǎn)品之間在特定時間段內(nèi)的重要關(guān)系, 知道序列模式后的產(chǎn)品運(yùn)營可以合理安排供應(yīng)鏈資源。
任務(wù)六:聚類(Clustering)
聚類可以對一個多樣化的群體進(jìn)行分割,從而形成一些更具有相似性的群體。
聚集通過對記錄進(jìn)行分組,從而將那些相似的記錄分割在一個聚集里。這些記錄之所以能夠被組織在一起,是因?yàn)樗麄儽旧砭痛嬖谀撤N相似性。聚集同分類的不同點(diǎn)是聚集不會對預(yù)先定義好的類進(jìn)行依賴,同時也不需要訓(xùn)練集。
任務(wù)七:優(yōu)化(Optimization)
優(yōu)化指的是優(yōu)化APP展現(xiàn)的設(shè)計和在線銷售的設(shè)計。
一般來說,這需要花很多的時間來考慮最優(yōu)的解決方案。遺傳算法(GA)常常是用于處理優(yōu)化技術(shù)的,如用于尋找解決方案的遺傳選擇、交叉和變異的優(yōu)化技術(shù)。例如:遺傳算法可以為APP的頁面創(chuàng)建數(shù)以千種的設(shè)置和組合。
任務(wù)八:描述和可視化(Description and Visualization)
是對數(shù)據(jù)挖掘結(jié)果的表示方式。
數(shù)據(jù)挖掘的目的之一是支撐業(yè)務(wù)發(fā)展。另外可視化技術(shù)可以將隱藏在表格或文本中的聚類和聯(lián)系直觀且迅速地展示在人們面前。
數(shù)據(jù)挖掘可以用來描述一個廣泛的運(yùn)營活動。
例如:一家4S銷售公司可以利用這項(xiàng)技術(shù),來挖掘用戶反饋的歷史數(shù)據(jù),建立許多預(yù)測模型,并做出相應(yīng)的對策,比如:用一條短信,或者打一個電話,來對客戶進(jìn)行游說。
時下常常能看到「后移動互聯(lián)網(wǎng)」、「未來十年最好的一年」等聳人聽聞又模棱兩可的話語,告別了流量就是一切的時代,我們產(chǎn)品運(yùn)營對于數(shù)據(jù)為基礎(chǔ),AI算法為突破的學(xué)習(xí)與思考從未像今天這樣急需和尖銳。
由于移動互聯(lián)網(wǎng)的普及和個性化的社會趨勢,數(shù)據(jù)挖掘技術(shù)將會被普遍用來分析用戶購買的產(chǎn)品服務(wù)的行為。這是為了找出用戶的偏好,并為用戶提供相關(guān)產(chǎn)品信息,以增加銷售額和銷售價格。
那么先知道數(shù)據(jù)挖掘流程先挖掘出來用戶的喜好的產(chǎn)品運(yùn)營團(tuán)隊(duì)再配合推薦算法,這樣就可以在產(chǎn)品運(yùn)營上領(lǐng)先競品一步。
如果你想系統(tǒng)化入門AI產(chǎn)品經(jīng)理,掌握AI產(chǎn)品經(jīng)理的落地工作方法,戳這里>http://996.pm/7bjab
#專欄作家#
連詩路,公眾號:LineLian。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進(jìn)化論:AI+時代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
把數(shù)據(jù)做好去挖掘客戶需求
數(shù)據(jù)挖掘工程師的重要性