當(dāng)投票有了權(quán)重,事情會變得不一樣嗎?
![](http://image.woshipm.com/wp-files/img/45.jpg)
目前大多涉及打分、投票的網(wǎng)站,所有參與用戶的權(quán)重都是一樣的。但這其實存在一些問題。
評分、評星、投票是很多網(wǎng)站的標(biāo)配,比如淘寶的寶貝評價、知乎的贊同。有些網(wǎng)站甚至以這些功能為生存根基,比如大眾點評、豆瓣等應(yīng)用,用戶的打分、評論是它們的主要功能,目的就是對不同對象進行排序,從而為有需求的用戶提供決策依據(jù)。
一、存在問題
1.針對單一項目:由于偏好等主觀因素和專業(yè)性等客觀因素導(dǎo)致結(jié)果失真
以大眾點評為例,吃是一件很個性化的事情,是完全基于主觀感受的,這就導(dǎo)致結(jié)果的參考性并不強。舉個例子,兩個人同時去吃泰國菜,對于喜歡這種酸辣口味的人來說,會覺得這家餐廳很好吃,那么他在打分的時候就會偏高了打;而對于吃不慣泰式口味的人就會覺得這家店很難吃,打分的時候自然會往偏低了打。假設(shè)在短時間內(nèi),去這家泰國餐廳吃飯的人以吃不慣泰國菜的人居多,最后評分總體偏低,此時一個喜歡吃泰國菜的人在大眾點評上看見這家店評分太低就不去吃了,但其實總的來說這家店的口味是中上水平的,那這時候這個評分就會對用戶產(chǎn)生誤導(dǎo)作用。而這個誤導(dǎo)作用的根源就是因為沒有對用戶進行劃分,所有用戶的打分占比的權(quán)重是一樣的,沒有把其中真正有效的打分從眾多無效打分中區(qū)分出來。
通過劃分用戶屬性改變權(quán)重來增強結(jié)果的有效性:
針對大眾點評而言,我認(rèn)為合理的打分機制應(yīng)該是這樣的:首先對用戶的偏好口味和商家的口味都進行標(biāo)簽化,然后當(dāng)用戶打分的時候,將用戶的偏好和商家的進行匹配,再根據(jù)兩者的匹配度給用戶分配一定的權(quán)重。為什么這樣合理呢?我舉一個有點極端的例子:
原來的打分機制就好像一群身份完全不同的人,醫(yī)生、律師、投資人、學(xué)生、家庭主婦、清潔工等等聚集在一起討論一個醫(yī)學(xué)問題,然后得出了一個平均答案。而我說的這種投票機制也是同樣一群人,不同的是我把其中的醫(yī)生區(qū)分出來,給他們賦予了更多的權(quán)利,在統(tǒng)計結(jié)果的時候主要參考他們的意見,然后再輔之以其他人群的意見。對兩種打分機制進行比較,顯然后者統(tǒng)計的結(jié)果更具參考意義。
歸根究底就是權(quán)重兩個字。
首先,劃分用戶身份;然后,根據(jù)具體情況分配權(quán)重;最后,計算出加權(quán)分。其實最根本的問題是如何區(qū)分用戶身份。我前面提供了一種標(biāo)簽化的方法,根據(jù)一定的屬性來細(xì)化用戶身份。我設(shè)想的大眾點評打分機制其實就是根據(jù)兩者的共同點來匹配雙方。像知乎,也有人提議對贊同根據(jù)專業(yè)領(lǐng)域進行加權(quán)。比如中醫(yī)的討論,就應(yīng)該以醫(yī)界人士的意見為準(zhǔn),那么學(xué)醫(yī)人士的一票贊同就應(yīng)該等于普通人的1.5票(1.5票只是舉例,沒有科學(xué)依據(jù))。
2.針對多個項目:由于參與人數(shù)差異導(dǎo)致的不可比較性
以電影點評網(wǎng)站為例,這里就有一個問題:熱門電影與冷門電影的平均得分,是否真的可比?舉例來說,一部好萊塢大片有10000個觀眾投票,一部小成本的文藝片只有100個觀眾投票。這兩者的投票結(jié)果,怎么比較?如何才能公平地反映出一部電影真正的質(zhì)量?
通過加權(quán)分來彌補差異:
一個合理的思路是,如果要比較兩部電影的好壞,至少應(yīng)該請同樣多的觀眾觀看和評分。既然文藝片的觀眾人數(shù)偏少,那么應(yīng)該設(shè)法為它增加一些觀眾。IMDB網(wǎng)站是目前互聯(lián)網(wǎng)上最為權(quán)威、系統(tǒng)、全面的電影資料網(wǎng)站,它所特有的電影評分系統(tǒng)深受影迷的歡迎,注冊用戶可以給任何一部影片打分并加以評述,網(wǎng)站又會根據(jù)影片所得平均分、選票的數(shù)目等計算得出影片的加權(quán)平均分并以此進行TOP250(最佳250部影片)和Bottom100(最差100部影片)的排行。
根據(jù)IMDB網(wǎng)站上公布的TOP250評分標(biāo)準(zhǔn),IMDB top 250用的是貝葉斯統(tǒng)計的算法得出的加權(quán)分(Weighted Rank-WR),公式如下:
WR = ( v/(v+m) )×R + (m÷(v+m) )×C
其中:
- R是用普通的方法計算出的平均分;
- v是參與投票的人數(shù);
- m是進入IMDB top 250需要的最小票數(shù);
- C 是目前所有電影的平均得分。
仔細(xì)研究這個公式,你會發(fā)現(xiàn),IMDB為每部電影增加了m張選票,并且這些選票的基本評分都為c。這樣做的原因是,假設(shè)所有電影都至少有m張選票,那么就都具備了進入前250名的評選條件;然后假設(shè)這m張選票的評分是所有電影的平均得分;最后,用現(xiàn)有的觀眾投票進行修正,長期來看,v/(v+m)這部分的權(quán)重將越來越大,得分將慢慢接近真實情況。這樣做拉近了不同電影之間投票人數(shù)的差異,使得投票人數(shù)較少的電影也有可能排名前列。
二、權(quán)重是否違背了公平原則
無論打分還是投票,我們都是秉著公平公正公開的原則,如果給一個人多一點權(quán)利,是不是就違背了公平?其實并不然。
什么是公平?我的老師曾這樣給我解釋:真正的公平是,公交上所有的女性、兒童、老人都有座位,而不再這范圍之內(nèi)的男性都站著。我們并不是生而平等的。我所謂的生而不平等是指:術(shù)業(yè)有專攻,在不同的專業(yè)領(lǐng)域我們這些業(yè)余的就是沒有專家的科學(xué)和權(quán)威。那么如何突出他們的身份?加權(quán)。因為只有這樣,我們才能得出最精準(zhǔn)、最科學(xué)的結(jié)果。
三、加權(quán)的其他意義
區(qū)分核心用戶,避免惡意打分/投票
下面再給大家分享一種付費用戶權(quán)重大的例子。
造作是一個C2B的家具電商平臺。在家具設(shè)計方面,用戶通過投票參與設(shè)計;造作給出用戶使用場景、材料、解決方式等命題,設(shè)計師會給出設(shè)計方案,用戶進行投票,得票高的設(shè)計進入后續(xù)生產(chǎn)。在投票過程中,造作會考慮到所有用戶的意見,但付費用戶的權(quán)重更大。
造作為什么要這樣做呢?在我看來,造作是為了通過付費這一行為,一方面使來篩選出平臺的核心用戶。用戶行為代表了他的消費傾向和消費潛力。平臺可以把這些消費傾向和消費潛力直接和產(chǎn)品掛起鉤來,這會讓平臺的銷售顯得無比精準(zhǔn)。另一方面,付費用戶較高的權(quán)重可以從一定程度上彌補部分搗亂分子的亂投票、惡意打分。我們不可能保證每一分每一票都是有效的,只能通過某些手段盡量減少這些無效打分無效投票。
避免同票同分的尷尬場面
當(dāng)我們做決策的時候最害怕出現(xiàn)平局的現(xiàn)象,這往往使得我們陷入選擇困難或者重選的局面。那么在這種情況下,權(quán)重就發(fā)揮其作用了。怎么理解呢:舉一個通俗易懂的例子:玩過狼人殺的朋友都知道,警長是擁有1.5票投票權(quán)的,為什么呢?因為白天票人的時候很有可能出現(xiàn)平票的情況,那就要進行二次陳述、二次投票,而第二次的投票結(jié)果說不定仍然是平票,陷入死循環(huán)。此時警長那多出來的0.5票就可以完美解決這個問題了。
以上純屬個人的一些小想法,歡迎大家指錯、討論。
作者:Lighthouse_長腿哥哥,Lighthouse互聯(lián)網(wǎng)實驗室一員,微信公眾號ID:Lighthouse
本文由 @Lighthouse_長腿哥哥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
很好