數(shù)據(jù)建模:會(huì)話切割

2 評(píng)論 6314 瀏覽 21 收藏 5 分鐘

會(huì)話切割,關(guān)乎會(huì)話類數(shù)據(jù)指標(biāo)的準(zhǔn)確性:比如用戶使用時(shí)長(zhǎng),啟動(dòng)次數(shù)等。文章從會(huì)話的基礎(chǔ)概念出發(fā),對(duì)會(huì)話相關(guān)的數(shù)據(jù)指標(biāo)和會(huì)話切割展開(kāi)了分析總結(jié),與大家分享。

01 什么是用戶會(huì)話

用戶會(huì)話(技術(shù)領(lǐng)域叫session)就是用戶在某個(gè)時(shí)間,對(duì)App或者網(wǎng)站進(jìn)行了一次訪問(wèn)。既然用戶訪問(wèn)了我們的產(chǎn)品,那我們就想知道在一次訪問(wèn)中,用戶都干了啥,停留了多長(zhǎng)時(shí)間。基于這些數(shù)據(jù)需求,于是產(chǎn)生了會(huì)話相關(guān)的數(shù)據(jù)需求。

02 會(huì)話相關(guān)的數(shù)據(jù)指標(biāo)

與會(huì)話相關(guān)的數(shù)據(jù)指標(biāo),有很多,以下例舉一些:

  • 訪問(wèn)次數(shù):即所有用戶的會(huì)話總數(shù)(也即session數(shù))
  • 平均交互深度:所有 session 內(nèi)事件數(shù)之和/訪問(wèn)次數(shù)
  • 使用時(shí)長(zhǎng):訪客一次訪問(wèn)會(huì)話中所持續(xù)的時(shí)間
  • 平均使用時(shí)長(zhǎng):所有訪客的總訪問(wèn)時(shí)長(zhǎng) / 訪問(wèn)次數(shù)
  • 頁(yè)面平均停留時(shí)長(zhǎng):等于該頁(yè)面停留時(shí)長(zhǎng)的總和 /該頁(yè)面的pv
  • 跳出率:一個(gè)會(huì)話中,只產(chǎn)生了一個(gè)事件,則為跳出。跳出率,分為頁(yè)面的跳出率和全站的跳出率。頁(yè)面的跳出率為該頁(yè)面的跳出數(shù)/該頁(yè)面的pv;全站跳出率則為總的跳出數(shù)/全站總的訪問(wèn)次數(shù)
  • 頁(yè)面退出率:當(dāng)用戶從某個(gè)頁(yè)面結(jié)束了會(huì)話,則稱從該頁(yè)面退出。頁(yè)面退出率等于該頁(yè)面退出數(shù)/該頁(yè)面的pv

03 會(huì)話切割

傳統(tǒng)的會(huì)話切割:傳統(tǒng)的會(huì)話切割方法,是規(guī)定一個(gè)時(shí)間間隔,如果用戶在這個(gè)時(shí)間間隔內(nèi),沒(méi)有做任何操作,那間隔時(shí)間外的下一次的操作則將被當(dāng)做新的一次會(huì)話。比如用戶點(diǎn)擊了搜索按鈕后,在30分鐘內(nèi),沒(méi)有在進(jìn)行任何操作,那么30分鐘后,如果用戶再次操作,則這一次的操作會(huì)被當(dāng)做新會(huì)話。

傳統(tǒng)會(huì)話切割的不足:傳統(tǒng)的會(huì)話切割,按照時(shí)間要求(一般Web網(wǎng)站的會(huì)話(session)過(guò)期時(shí)間為30分鐘,App的會(huì)話(session)過(guò)期時(shí)間為1分鐘)切割會(huì)話,相同的會(huì)話生成同一個(gè)session_id,然后通過(guò)埋點(diǎn)上報(bào)到數(shù)據(jù)平臺(tái)。這種做法的問(wèn)題就是事先定死了切割時(shí)間,不夠靈活,無(wú)法滿足不同業(yè)務(wù)需求場(chǎng)景。

新的會(huì)話切割:新的會(huì)話切割方法,將切割這個(gè)動(dòng)作,放到數(shù)據(jù)清洗階段,根據(jù)需求,自定義切割時(shí)間以及會(huì)話的開(kāi)始、結(jié)束事件,然后相同的會(huì)話生成一個(gè)相同的session_id。

新的會(huì)話切割規(guī)則舉例(假如規(guī)定切割時(shí)間為1分鐘):

(1)將用戶的行為序列,按照發(fā)生時(shí)間遠(yuǎn)到近進(jìn)行排序

(2)以歷史第一個(gè)事件作為起點(diǎn),向后進(jìn)行匹配

1)如果事件兩兩間隔時(shí)間在1分鐘內(nèi),匹配到啟動(dòng)App這個(gè)事件,那么會(huì)話自動(dòng)切斷,以App這個(gè)事件重新作為起點(diǎn),進(jìn)行第二個(gè)session匹配

2)如果事件兩兩間隔時(shí)間在1分鐘內(nèi),匹配到退出App這個(gè)事件,那么會(huì)話自動(dòng)切斷,將退出App事件納入本次會(huì)話,以下一個(gè)事件進(jìn)行第二個(gè)session匹配

3)如果事件兩兩間隔時(shí)間在1分鐘內(nèi),即沒(méi)有匹配到app啟動(dòng)事件、也沒(méi)有匹配到退出App事件,那么如果兩兩事件間隔時(shí)間大于1分鐘,則自動(dòng)切斷,重新開(kāi)始會(huì)話

 

本文由 @如琴留音 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 啟動(dòng)App為什么會(huì)切割會(huì)話,如果是在1min這個(gè)閾值內(nèi)應(yīng)該還是算在一個(gè)session內(nèi)吧

    來(lái)自上海 回復(fù)
  2. 這個(gè)寫(xiě)得很有意思

    來(lái)自廣東 回復(fù)