免费人妻AⅤ无码专区久久综合，亚洲国产综合久久五月，国产三级片网，国产精品久久久久免费A∨下载，亚洲乱码尤物193yw在线播放，亚洲人成在线观看影院，亚洲欧美动漫传媒国产日韩，91在线无码精品秘入口竹菊

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

如何搭建一個(gè)case評(píng)測(cè)流程（一）

策略產(chǎn)品夏師傅

2020-09-08

4 評(píng)論 12911 瀏覽 34 收藏

13 分鐘

編輯導(dǎo)語：一個(gè)產(chǎn)品經(jīng)理在日常工作中不可避免的內(nèi)容就是處理業(yè)務(wù)badcase，然而很多團(tuán)隊(duì)、PM對(duì)于badcase的處理還停留在發(fā)現(xiàn)一個(gè)問題，處理一個(gè)問題階段，效率低到可怕。本文作者結(jié)合自身的工作經(jīng)驗(yàn)，為我們分析了如何搭建一個(gè)case評(píng)測(cè)流程。

badcase，是互聯(lián)網(wǎng)產(chǎn)品行業(yè)非常流行的一個(gè)術(shù)語，尤其是搜索、推薦策略產(chǎn)品領(lǐng)域經(jīng)常會(huì)涉及到對(duì)badcase處理。

一個(gè)case，可以區(qū)分為goodcase和badcase。

顧名思義，badcase就是“壞例”，主要是指由于機(jī)制缺陷導(dǎo)致一些給用戶、商家、平臺(tái)帶來較差體驗(yàn)的事件。它和bug的區(qū)別就在于badcase影響的是產(chǎn)品體驗(yàn)層面，對(duì)用戶使用當(dāng)前產(chǎn)品，享受正常的產(chǎn)品服務(wù)沒有太大的影響。

也正是因?yàn)槿绱?，包括我待過的公司，以及據(jù)身邊很多同行的反饋，都缺少一個(gè)主動(dòng)的、標(biāo)準(zhǔn)化的badcase處理流程。很多團(tuán)隊(duì)、PM對(duì)于badcase的處理還停留在發(fā)現(xiàn)一個(gè)問題，處理一個(gè)問題階段，效率低到可怕。

一、策略不確定性

badcase為什么會(huì)主要在策略領(lǐng)域比較多，而在前端、功能類產(chǎn)品中比價(jià)少，這個(gè)其實(shí)本身是由策略產(chǎn)品的不確定性造成的。

我們做一個(gè)功能，上一個(gè)頁面，其實(shí)整個(gè)交付結(jié)果是確認(rèn)無疑的；包括功能背后的交互流程、業(yè)務(wù)邏輯、到一個(gè)頁面的布局，用色都不能出現(xiàn)像素級(jí)別的差距，有錯(cuò)誤，那就是bug！

但是策略就不一樣了，它對(duì)應(yīng)的結(jié)果通常是不確定的。

比如搜索結(jié)果的排序，其背后是由很多策略模型共同作用決定的，比如價(jià)格模型、銷量模型、轉(zhuǎn)化預(yù)測(cè)模型等等。而且隨著各種非規(guī)則、非約束類策略的應(yīng)用，看起來就更像一個(gè)“黑盒”，源源不斷的輸出它的計(jì)算結(jié)果，很難定位到某個(gè)結(jié)果是由單一的策略導(dǎo)致的。

所以，每當(dāng)有人反饋說“我們上了低價(jià)模型策略，為啥有些價(jià)格低的物品在搜索結(jié)果中還是沒有排在前面”，這個(gè)其實(shí)就是策略的一種不確定性，低價(jià)策略并不能保證所有價(jià)格低的物品都排序靠前，它更多的是一種保證業(yè)務(wù)生態(tài)健康的考量。

二、怎么做

需要主動(dòng)一點(diǎn)，為了發(fā)現(xiàn)badcase，本身就值得建立一個(gè)標(biāo)準(zhǔn)的case評(píng)測(cè)流程。

當(dāng)前很多團(tuán)隊(duì)badcase都來源于“第三方”反饋，商家、業(yè)務(wù)、運(yùn)營或者用戶，缺少主動(dòng)反饋，發(fā)起自測(cè)的機(jī)制。

首先：真正的badcase本身就是策略缺陷導(dǎo)致的，因此這是一個(gè)非常好的策略迭代優(yōu)化的觸發(fā)點(diǎn)，要比競品分析、產(chǎn)品規(guī)劃更具象，迭代速度和效果反饋更快。

另外：僅僅接收第三方的反饋肯定是有一些局限性的，每方在反饋badcase的時(shí)候，都是基于各自的利益點(diǎn)闡述的，而策略產(chǎn)品則需要考慮的是整個(gè)大盤的方案。

如何完成一個(gè)完整的case的評(píng)測(cè)流程搭建？

1. 評(píng)測(cè)標(biāo)準(zhǔn)制定

評(píng)測(cè)標(biāo)準(zhǔn)是case評(píng)測(cè)的唯一依據(jù)，也是保證評(píng)測(cè)結(jié)果質(zhì)量的關(guān)鍵所在。

它就類似一部法規(guī)，用來幫助判斷各種case是否為badcase，及其嚴(yán)重程度，因此在建立case評(píng)測(cè)流程之前，首先就需要制定一個(gè)評(píng)測(cè)標(biāo)準(zhǔn)。

以搜索case評(píng)測(cè)為例，通常badcase標(biāo)準(zhǔn)包含兩個(gè)方向的內(nèi)容：召回和排序。

召回：主要是規(guī)定判斷召回結(jié)果與query的相關(guān)性的規(guī)則，一般分為精確相關(guān)、高相關(guān)、低相關(guān)、無關(guān)四種。
排序：主要是規(guī)定判斷召回結(jié)果中排序的合理性的規(guī)則，通常排序會(huì)與物品的質(zhì)量度掛鉤，因此這塊還需要定義物品的質(zhì)量度。比如質(zhì)量度高排序靠后，質(zhì)量度低排序靠前等都可以定義為badcase。

除了上述兩大方面，還有很多細(xì)則需要單獨(dú)進(jìn)行定義，比如圖片質(zhì)量、標(biāo)題質(zhì)量等等。

這里需要注意的是如同法律法規(guī)會(huì)有刑事、民事、行政、經(jīng)濟(jì)等分類，評(píng)測(cè)標(biāo)準(zhǔn)也需要按照不同的業(yè)務(wù)領(lǐng)域進(jìn)行個(gè)性化定制。比如商品和藥品，判別的標(biāo)準(zhǔn)就會(huì)有區(qū)別，所以需要單獨(dú)制定對(duì)應(yīng)的評(píng)測(cè)標(biāo)準(zhǔn)。

有個(gè)case評(píng)測(cè)標(biāo)準(zhǔn)以后，就可以正式開始進(jìn)行case評(píng)測(cè)。

2. 怎么進(jìn)行case評(píng)測(cè)

1）誰來參與

通常在搜索團(tuán)隊(duì)內(nèi)部，會(huì)把這個(gè)事情定義為“搜索用戶滿意度評(píng)測(cè)項(xiàng)目”，以便更好的進(jìn)行組織和推進(jìn)。

立項(xiàng)之后需要定義項(xiàng)目的參與方，“搜索滿意度評(píng)測(cè)”一般包含這幾個(gè)角色：項(xiàng)目負(fù)責(zé)人、產(chǎn)品經(jīng)理，算法工程師，開發(fā)工程師，他們的分工不一樣。

項(xiàng)目負(fù)責(zé)人：主要負(fù)責(zé)整個(gè)評(píng)測(cè)項(xiàng)目的時(shí)間計(jì)劃制定，溝通機(jī)制建立，評(píng)測(cè)意見統(tǒng)一以及評(píng)測(cè)過程中遇到的問題處理；
產(chǎn)品經(jīng)理：負(fù)責(zé)具體case的測(cè)評(píng)，評(píng)測(cè)報(bào)告的撰寫以及評(píng)測(cè)標(biāo)準(zhǔn)修訂建議收集；
算法工程師：負(fù)責(zé)具體case的評(píng)測(cè)，case歸因分析；
開發(fā)工程師：負(fù)責(zé)具體case的評(píng)測(cè)，一般參與較少。

這里簡單解釋一下算法工程師和開發(fā)工程師，有的團(tuán)隊(duì)可能不會(huì)進(jìn)行區(qū)分，統(tǒng)一稱之為工程師；有的會(huì)做區(qū)分，算法工程師主要是負(fù)責(zé)人策略中算法、模型的開發(fā)；開發(fā)工程師則主要負(fù)責(zé)工程段的開發(fā)，通常指的是后端、服務(wù)端。

另外，搜索滿意度評(píng)測(cè)項(xiàng)目的實(shí)施周期可以按照搜索迭代計(jì)劃的快慢進(jìn)行靈活設(shè)置。

在迭代較快的情況下，測(cè)評(píng)的頻率也會(huì)相應(yīng)加快，我見過一些團(tuán)隊(duì)一周一次；如果迭代較慢，或者優(yōu)化項(xiàng)目周期跨度較長，可以適當(dāng)把測(cè)評(píng)周期拉長，我們之前做的是2個(gè)月一次。

2）case抽樣

case抽樣是指提取評(píng)測(cè)案例，一般是由工程師通過sql在搜索日志中取數(shù)。

對(duì)于搜索來說，一個(gè)case最基本需要包括用戶id，搜索關(guān)鍵詞和搜索結(jié)果。隨著業(yè)務(wù)的不同需要抽取的數(shù)據(jù)不同，比如在美團(tuán)還需要抽取搜索時(shí)間，搜索地點(diǎn)等。

對(duì)樣本的要求一般包括如下幾方面：

時(shí)間上一般選擇測(cè)評(píng)周期內(nèi)的最后一周，這個(gè)時(shí)候相關(guān)的優(yōu)化策略基本上都生效；
case的數(shù)量按照項(xiàng)目參與人員的多少來確定，人均100個(gè)左右；
對(duì)于中臺(tái)搜索通常會(huì)服務(wù)于若干條業(yè)務(wù)線，因此需要控制好不同業(yè)務(wù)之間的case數(shù)量比例；
總體的抽取規(guī)則采用隨機(jī)抽取的方式，保證測(cè)評(píng)結(jié)果的可信度。

需要注意的是，隨機(jī)抽出的case很多時(shí)候都是無效case，比如：無關(guān)鍵詞，關(guān)鍵詞是特殊字符等等。

但是只有基于有效case來進(jìn)行評(píng)測(cè)，這樣結(jié)果才可信，所以還需要對(duì)抽樣結(jié)果進(jìn)行過濾，一般抽樣的時(shí)候會(huì)比計(jì)劃評(píng)測(cè)case數(shù)量要多一些。

3）case測(cè)評(píng)

case評(píng)測(cè)是指評(píng)測(cè)人員對(duì)抽樣后的case質(zhì)量進(jìn)行評(píng)估的一個(gè)過程，就類似閱卷，需要給每一份試卷進(jìn)行打分。

為了操作方便，在大型企業(yè)，一般都會(huì)自建case測(cè)評(píng)平臺(tái)，大家可以理解為這是一個(gè)case評(píng)測(cè)人員的協(xié)作平臺(tái)。它主要提供的功能就是對(duì)case進(jìn)行分配、篩選、查看、打分（分級(jí)）、若為badcase需要選擇原因，以及填寫備注。

注意這里的打分并不是按照評(píng)測(cè)人員的主觀判斷進(jìn)行打分，而是會(huì)提前制定一個(gè)算法，算法大概的思路就是不同的badcase結(jié)果有不同的分?jǐn)?shù)和權(quán)重，根據(jù)評(píng)測(cè)人員選擇的原因分類自動(dòng)進(jìn)行分?jǐn)?shù)計(jì)算。

比如：評(píng)測(cè)人員選擇badcase原因是無關(guān)商品排序靠前，記為0分；若是低相關(guān)商品排序靠前，則為3分。通俗理解就是，badcase越嚴(yán)重，得分越低，也意味著對(duì)用戶體驗(yàn)傷害越大。

case的評(píng)測(cè)最重要的前提就是需要定一個(gè)評(píng)測(cè)的標(biāo)準(zhǔn)，這里大家要注意的是，標(biāo)準(zhǔn)不是一成不變的，每一次評(píng)測(cè)都是一次優(yōu)化、完善標(biāo)準(zhǔn)的機(jī)會(huì)。

4）冗余評(píng)測(cè)

大多數(shù)團(tuán)隊(duì)在進(jìn)行了評(píng)測(cè)之后就開始進(jìn)行數(shù)據(jù)統(tǒng)計(jì)，看看goodcase有多少、badcase有多少，然后基于這兩個(gè)數(shù)據(jù)計(jì)算當(dāng)前評(píng)估周期的滿意度。

搜索滿意度的計(jì)算方式為：

goodcase/(goodcase+badcase)*100%

這里無論是goodcase還是badcase，都是指的有效的case。

由于評(píng)測(cè)的標(biāo)準(zhǔn)是人工制定的，因此經(jīng)常出現(xiàn)一些標(biāo)準(zhǔn)沒有覆蓋的case，以及大家理解不一致的地方，因此這個(gè)時(shí)候就需要加一個(gè)冗余case評(píng)測(cè)環(huán)節(jié)。

冗余評(píng)測(cè)就是對(duì)評(píng)測(cè)過程中有意見分歧的case進(jìn)行項(xiàng)目組成員集體評(píng)測(cè)，最終做出決策。顯然冗余評(píng)測(cè)的目的除了能夠保證滿意度結(jié)果的公正，更為重要的一環(huán)是基于大家對(duì)badcase的不同理解，去完善評(píng)測(cè)標(biāo)準(zhǔn)。

評(píng)測(cè)標(biāo)準(zhǔn)可以說是滿意度評(píng)測(cè)的根本，只有標(biāo)準(zhǔn)制定的好，才能產(chǎn)出一個(gè)客觀的滿意度結(jié)果。我微信后臺(tái)放了一個(gè)評(píng)測(cè)標(biāo)準(zhǔn)的模板，大家可以輸入模板來獲取。

5）case歸因

case評(píng)測(cè)的直接目標(biāo)是衡量搜索的滿意度，但是根本目標(biāo)還是通過badcase明確、指導(dǎo)搜索策略優(yōu)化。

因此，當(dāng)case評(píng)測(cè)進(jìn)行了bad和good判定之后，最后一個(gè)環(huán)節(jié)就是case歸因。簡單來說，就是分析造成每一個(gè)badcase的原因是什么？

一般來講對(duì)于搜索badcase，包含下面幾類

詞典問題
查詢分析問題
召回問題
排序問題
前端問題

這一塊下一篇再詳細(xì)講解。

#專欄作家#

夏唬人，公眾號(hào)：夏唬人，人人都是產(chǎn)品經(jīng)理專欄作家。某廠策略產(chǎn)品經(jīng)理，關(guān)注推薦，搜索，AI策略方向，用數(shù)據(jù)來賦能業(yè)務(wù)。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自 Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

策略產(chǎn)品夏師傅

公眾號(hào)：策略產(chǎn)品夏師傅，京東美團(tuán)阿里快手高級(jí)策略產(chǎn)品專家，搜索業(yè)務(wù)負(fù)責(zé)人

40篇作品 360815總閱讀量

困在網(wǎng)頁里的ChatGPT，想在移動(dòng)生態(tài)里突圍

06-291051 瀏覽

戶外UP主那么多，為什么只有徐云成了B站頂流？

03-165253 瀏覽

電商的終點(diǎn)是線下？一位電商朋友帶給我的思考…

11-222833 瀏覽

社交App都在出海，這家大廠卻偏在國內(nèi)推新

06-292958 瀏覽

都在搶發(fā)AI大模型，誰在關(guān)注模型安全？

04-132986 瀏覽

評(píng)論

flywiang

還

最近來自廣東回復(fù)
AlwaysOnli

是這樣評(píng)測(cè)嗎

最近來自山東回復(fù)
1. flywiang 回復(fù)AlwaysOnli
  
  你
  
  最近來自廣東回復(fù)
2. flywiang 回復(fù)AlwaysOnli
  
  合計(jì)
  
  最近來自廣東回復(fù)