產(chǎn)品策略算法——神奇的對數(shù)
在產(chǎn)品策略公式中,如果加減乘除實在搞不定,那么你可以試著用一下對數(shù)。
1. 生活中的對數(shù)
作為一個數(shù)學渣,實在無力從對數(shù)的起源開始一番復(fù)雜的推導(dǎo)然后再得出結(jié)論。直接給出一個判斷吧——需要用對數(shù)處理才能很好計算的數(shù)據(jù),基本上都是符合長尾分布的數(shù)據(jù)。
長尾分布的特點是,少數(shù)的item集中了大量的份額,但是在數(shù)值上,尾部的item的數(shù)值下降非常緩慢,不會直接下降為零。這么說可能有點蒼白,那么舉幾個例子好了。
人的收入,年收入1萬~10萬的人是大多數(shù),年收入10萬~100萬的比較少,年收入大于1000萬的更少,但是年收入大于1000萬的人卻占據(jù)了社會財富的大多數(shù)份額。
電商中,店鋪銷量最高的店鋪占據(jù)了GMV的大多數(shù),商品頭部爆款占據(jù)了GMV的大多數(shù)。
知乎中,頭部的大V占據(jù)了大多數(shù)的關(guān)注,高票答案占據(jù)了知乎大多數(shù)的贊同。
自然界,對于地震的衡量是使用對數(shù)的,地震等級每相差2級,能量增加1000倍。
人的感覺上的強度,大約和刺激強度的對數(shù)成正比。比如,我們感覺聲音大了一倍,不是因為聲源功率增加了一倍,而是聲源功率增加了一個數(shù)量級。
2. 一個幾乎萬能公式
其實在之前的文章中,不止一次出現(xiàn)過對數(shù)的使用。比如:
在《Feed流設(shè)計:怎樣用策略掌控用戶視線》中,介紹了一個來自Reddit的核心排序算法,在兼顧了Feed流中頭部都是熱門數(shù)據(jù)的基礎(chǔ)上,能夠自動完成數(shù)據(jù)的更新。
在《【搜索Case分享】五分鐘,教你優(yōu)化知乎搜索》中,最終給出的用戶搜索排序算法,既保證了用戶之間的關(guān)注關(guān)系得到了尊重,也保證了用戶的搜索相關(guān)度得到了尊重,同時也保證了粉絲數(shù)和贊同數(shù)能起到作用。
這些例子其實都是下面這個幾乎萬能的公式的變形:
其中a代表根據(jù)需求需要調(diào)整的參數(shù),M代表業(yè)務(wù)數(shù)據(jù),M之所以要+1,一方面是歷史的進程,另一方面也是為了保證為正值。這個公式是為了平衡長尾分布的業(yè)務(wù)數(shù)據(jù)與有界的關(guān)鍵性數(shù)據(jù)之間的關(guān)系。
這個公式之所以說萬能,是因為大部分產(chǎn)品數(shù)據(jù)都可以分為長尾分布的業(yè)務(wù)數(shù)據(jù),或者有界的關(guān)鍵數(shù)據(jù)。比如搜索就是典型的例子,長尾的業(yè)務(wù)數(shù)據(jù)就是銷量或者點擊量,有界的關(guān)鍵性數(shù)據(jù)就是文本相關(guān)度。
3. 策略公式的應(yīng)用
接下來就是舉例子的時刻了。
場景一:假如淘寶店鋪,年末要搞一個最佳店鋪排行榜
這個時候肯定是要用到GMV(銷售額),也需要用到DSR(detail seller rating,就是寶貝描述,服務(wù)態(tài)度,發(fā)貨速度這些)。上面我們已經(jīng)討論了,淘寶的銷量是數(shù)量差別是非常大的。大店鋪每月銷售額10億的數(shù)量級,小的精品店10萬銷售額也不錯。如果單純用銷量去排列,很多精品店無法挖掘,如果單純用DSR排列,則不考慮GMV,這無法體現(xiàn)大店鋪的優(yōu)勢。
這個問題中,DSR是有界性關(guān)鍵指標,GMV為長尾分布的業(yè)務(wù)數(shù)據(jù)。那么排序公式可以是:
假如a取1:
- 一個GMV為1億,DSR為4分內(nèi)的店鋪A分數(shù)為11
- 一個GMV為1000萬,DSR為3分的店鋪B分數(shù)為10
- 另一個GMV為100萬,DSR為4.5分的店鋪C分數(shù)為10.5
A>C>B,比較起來就比較公平,一個店鋪的命運當然要考慮自己的努力(DSR),但是也好考慮歷史的進程(GMV)。
場景二:知乎要搞一個知乎最佳貢獻者排行
這個時候既要考慮這一年收獲了多少贊,也需要考慮這個人的答案質(zhì)量,假如粗暴地認為答案質(zhì)量度為(閱讀+5*點贊+15*收藏)/曝光次數(shù),如果只考慮質(zhì)量度,筆耕不輟的人怎么辦?如果只考慮收貨贊的數(shù)量,那么一些長期抖機靈沒營養(yǎng)的人可能會占便宜。
這個問題中,質(zhì)量度是有界性關(guān)鍵指標,點贊數(shù)為長尾分布的業(yè)務(wù)數(shù)據(jù)。那么排序公式可以是:
假如a取1:
- 一個用戶A答案質(zhì)量度為5,贊同數(shù)為1萬,則得分為9
- 一個用戶B答案質(zhì)量度為3.5,贊同數(shù)為10萬,則得分為8.5
用戶A排名大于B。
場景三:如何幫三毛找對象?
荷西問三毛:你想嫁個什么樣的人?
三毛說:看的順眼,千萬富翁也嫁。看的不順眼,億萬富翁也嫁。
荷西就說:那說來說去你還是想嫁個有錢的。
三毛看了荷西一眼說:也有例外的時候。
“那你要是嫁給我呢?”荷西問道,
三毛嘆了口氣說:要是你的話那只要夠吃飯的錢就夠了。
“那你吃的多嗎?”荷西問道。
“不多不多,以后還可以少吃一點。”三毛小心的說道。
在這個例子中主觀評分的是否順眼為關(guān)鍵性指標(假設(shè)為1~5),財富值為重要的業(yè)務(wù)指標。那么排序公式為:
因為三毛非常看重是否match(順眼),所以a我們假設(shè)為2,那么:
- 千萬富翁A,順眼指數(shù)為4,則得分15;
- 億萬富翁B,順眼指數(shù)為2,則得分12;
- 荷西沒錢,順眼指數(shù)為5,則得分為10。
這個時候我們發(fā)現(xiàn)這個公式?jīng)]有解決問題,荷西不是最高的。三毛會選擇千萬富翁。
hmmm,這就是為什么我說這個公式是一個幾乎萬能的公式,而不是萬能的公式。因為總有些異常的case需要進一步處理。
如果算法改為:
if(name=“荷西”)
{
score=100;
}
else
{
}
這個問題就迎刃而解了。
4. 總結(jié)
這確實是一個幾乎萬能的公式,但是M值怎么選取,X值怎么選取,參數(shù)怎么制定,就需要產(chǎn)品經(jīng)理對業(yè)務(wù)有自己的思考了。業(yè)務(wù)理解力是前提,公式的靈活運用,都是在業(yè)務(wù)理解力的前提下才能發(fā)揮作用。
理解公式是一個層次,靈活運用公式是一個層次,而在靈活運用公式的同時,再加上對業(yè)務(wù)的思考,則又是另一個層次了。
本文在使用的案例的都是比較理想案例,在真實案例中,數(shù)據(jù)往往不能直接比較,而是設(shè)置不同的參數(shù),那么有什么常見的闡述設(shè)置情形呢?又有什么常見的參數(shù)設(shè)置方法呢?
本文由 @潘一鳴 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
大佬新書什么時候上線,舉手報名預(yù)購
干貨哈 ??
請教:“這個問題中,質(zhì)量度是有界性關(guān)鍵指標,點贊數(shù)為長尾分布的業(yè)務(wù)數(shù)據(jù)。那么排序公式可以是”這句話種的“質(zhì)量度”是不是應(yīng)是“閱讀數(shù)”啊?
往前看,這里說的就是質(zhì)量度
有意思~
不裝逼的說。。。。公式一個沒看懂! ??
荷西的順眼指數(shù)是10086好嘛~
厲害
“M之所以要+1,一方面是歷史的進程”
太暴力了