虛假流量的認(rèn)知與識(shí)別(下篇)

5 評(píng)論 6852 瀏覽 23 收藏 14 分鐘

上篇圍繞虛假流量的發(fā)生機(jī)制、發(fā)生原因(背后的利益捆綁)、識(shí)別虛假流量的常見(jiàn)維度等;下篇從一個(gè)案例完整介紹如何識(shí)別虛假流量。

虛假流量的認(rèn)知與識(shí)別(上篇)中介紹,虛假流量的識(shí)別可從基本屬性、產(chǎn)品參與度、轉(zhuǎn)化情況三方面來(lái)識(shí)別。

  • 首先,基本屬性。具體包括:時(shí)間 & 地域維度、終端類(lèi)型、操作系統(tǒng)、聯(lián)網(wǎng)方式、運(yùn)營(yíng)商、IP 集中等
  • 其次,產(chǎn)品參與度。具體包括:跳出率、平均訪(fǎng)問(wèn)深度、平均訪(fǎng)問(wèn)時(shí)長(zhǎng)、用戶(hù)行為路徑、頁(yè)面點(diǎn)擊情況、流量留存情況、單頁(yè)面人均訪(fǎng)問(wèn)次數(shù)等。
  • 第三,轉(zhuǎn)化情況。因?yàn)楹芏嘧鞅琢髁靠梢阅7氯祟?lèi)行為,成功繞過(guò)跳出率、平均訪(fǎng)問(wèn)深度和停留時(shí)長(zhǎng)這些宏觀指標(biāo),但是要模仿一個(gè)業(yè)務(wù)轉(zhuǎn)化就 比較難了,如果宏觀指標(biāo)表現(xiàn)很好,業(yè)務(wù)轉(zhuǎn)化很少的話(huà),就需要提高警覺(jué)。

下面通過(guò)一個(gè)案例從用戶(hù)行為數(shù)據(jù)多維診斷虛假流量。這個(gè)案例圍繞上述三種A 企業(yè)是電商企業(yè),日常會(huì)在社會(huì)化媒體進(jìn)行廣告投放,在1月8日線(xiàn)上數(shù)據(jù)投放的常規(guī)檢查中發(fā)現(xiàn),近期一家媒體(下 稱(chēng)“M 渠道”)所帶來(lái)的流量數(shù)據(jù)異常大。為查明該媒體渠道所帶來(lái)的流量是否為虛假流量,A企業(yè)將M渠道下的用戶(hù)行為進(jìn)行多維度細(xì)分,進(jìn)行流量排查。

一. 基本屬性初步排查

流量訪(fǎng)問(wèn)通常會(huì)分布在一天中的各個(gè)時(shí)段,伴隨平滑的曲線(xiàn)形成訪(fǎng)問(wèn)高峰與低峰。顯然虛假流量不具備這一特點(diǎn),因?yàn)槿?為 / 機(jī)器操作為節(jié)省成本不會(huì)在意流量的時(shí)間分布,難免會(huì)在時(shí)間曲線(xiàn)上會(huì)有流量突增的情況。因此,要找到異常流量發(fā) 生的時(shí)間點(diǎn),將時(shí)間細(xì)化到每小時(shí)的訪(fǎng)問(wèn)數(shù)據(jù),如果流量過(guò)于集中在某個(gè)時(shí)段,或者在不恰當(dāng)?shù)臅r(shí)間點(diǎn)出現(xiàn)了流量激增的 情況,這時(shí)候就要引起注意了。

1. 時(shí)間維度

圖1?M 渠道與百度渠道流量對(duì)比

通過(guò)圖?1?看到,百度流量來(lái)源呈現(xiàn)平緩變化,從流量時(shí)間分布上看,基本符合正常訪(fǎng)問(wèn)情況。與之形成鮮明對(duì)比的是, M 渠道全天流量高峰期分別在 2:00、5:00、14:00、15:00。這幾個(gè)時(shí)段內(nèi)的流量過(guò)于集中,而在其他正常時(shí)段內(nèi),流量幾乎為零。 經(jīng)過(guò)內(nèi)部確認(rèn),該階段并未有活動(dòng)發(fā)生,產(chǎn)生突增的訪(fǎng)問(wèn)高峰十分可疑。

2. 用戶(hù)訪(fǎng)問(wèn)設(shè)備

圖2?從設(shè)備情況了解 M 渠道用戶(hù)的操作系統(tǒng)

上文提到在正常情況下,同樣用戶(hù)訪(fǎng)問(wèn)設(shè)備應(yīng)該多元化。在這個(gè)案例中,通過(guò)上圖發(fā)現(xiàn) M 渠道流量設(shè)備基本都是 Android 端。 由于 M 渠道未投放,更沒(méi)有設(shè)備限定,增加了虛假流量的可能性。

3. IP 集中

圖3?按 IP 查看 Web 瀏覽頁(yè)面觸發(fā)用戶(hù)數(shù)

一般而言,IP 的頻繁點(diǎn)擊、流量激增都是不正常的。我們通過(guò)數(shù)據(jù)可以看到,圖中 IP 帶來(lái)的流量在2:00、5:00和15:00 均有突變,尤其140.205.92.1 表現(xiàn)最明顯。經(jīng)過(guò)以上維度診斷,此流量十分可疑,可結(jié)合產(chǎn)品參與度進(jìn)行深度判定。

二. 產(chǎn)品參與度深度判定

1. 跳出率

虛假流量產(chǎn)生高跳出率的時(shí)間,通常會(huì)和用戶(hù)訪(fǎng)問(wèn)時(shí)間段一致。因此可以結(jié)合流量時(shí)間等因素進(jìn)行綜合對(duì)比。

圖4 M 渠道來(lái)源流量的跳出率

從圖?4?來(lái)看,該渠道來(lái)的用戶(hù)跳出率高達(dá)98.88%,說(shuō)明用戶(hù)通過(guò)渠道鏈接來(lái)到網(wǎng)站落地頁(yè)后,幾乎都沒(méi)有進(jìn)行進(jìn)一步 的瀏覽。

圖5?分時(shí)段查看 Web 跳出率

通過(guò) M 渠道用戶(hù)與非 M 渠道用戶(hù)跳出率情況的對(duì)比。我們可以看到,非 M 渠道用戶(hù)的跳出率變化比較平緩,分布在 80% 上下。而 M 渠道用戶(hù)跳出率的變化則是分時(shí)段網(wǎng)站突然增高的,突增的時(shí)段恰好和前面的訪(fǎng)問(wèn)突增時(shí)段吻合,比如凌晨 2:00 和 5:00 時(shí)段,這部分流量更值得懷疑。

當(dāng)然,即使 M 渠道流量從跳出率指標(biāo)上來(lái)看表現(xiàn)很好,我們也不能直接定位它一定就是真實(shí)的流量,還應(yīng)該結(jié)合訪(fǎng)問(wèn)深度 和訪(fǎng)問(wèn)時(shí)長(zhǎng)、訪(fǎng)問(wèn)路徑等來(lái)進(jìn)行深度分析。

2. 平均訪(fǎng)問(wèn)深度

圖 6 平均訪(fǎng)問(wèn)深度判定

從圖?6?中我們可以看到,M 渠道用戶(hù)一次訪(fǎng)問(wèn)平均瀏覽了 一 個(gè)頁(yè)面,說(shuō)明大部分的會(huì)話(huà)都是訪(fǎng)問(wèn)一個(gè)頁(yè)面就退出了,并 沒(méi)有進(jìn)行后續(xù)頁(yè)面瀏覽。

2. 平均訪(fǎng)問(wèn)時(shí)長(zhǎng)

如圖?7,M 渠道用戶(hù)平均在網(wǎng)站停留的時(shí)長(zhǎng) 6.2s。6s 的時(shí)間,可能大部分用戶(hù)是在網(wǎng)站都瀏覽 1-2 個(gè)頁(yè)面就退出,并無(wú) 明顯的交互行為。為了驗(yàn)證該猜想,可以看圖?8?的用戶(hù)路徑分析。

圖?7 M 渠道用戶(hù)的平均訪(fǎng)問(wèn)時(shí)長(zhǎng)分析

3. 用戶(hù)行為路徑

圖8 M 渠道用戶(hù)行為路徑

?圖9?用戶(hù)行為路徑“頁(yè)面訪(fǎng)問(wèn)”的節(jié)點(diǎn)信息

在這個(gè)案例中,圖?9?是 M 渠道用戶(hù)的前 4 次訪(fǎng)問(wèn)的分布情況,可以發(fā)現(xiàn),大部分用戶(hù)是先進(jìn)行的首頁(yè)面訪(fǎng)問(wèn) -> 退出。 通過(guò)節(jié)點(diǎn)信息查看,還可以發(fā)現(xiàn),在頁(yè)面訪(fǎng)問(wèn)后,99.08% 的用戶(hù)無(wú)后續(xù)動(dòng)作。

圖10?抽樣 M 渠道 30 個(gè)用戶(hù),其中 29 個(gè)用戶(hù)的行為路徑

圖11??抽樣 M 渠道 30 個(gè)用戶(hù),唯一用戶(hù)的行為路徑

在 M 渠道的用戶(hù)群體中,隨機(jī)抽取了 30 個(gè)用戶(hù),發(fā)現(xiàn)其中 29 個(gè)用戶(hù)為上圖情況,這批用戶(hù)具有相同的行為序列,來(lái)到落 地頁(yè)后均無(wú)后續(xù)動(dòng)作而退出。 針對(duì)唯一有后續(xù)行為的用戶(hù),通過(guò)行為序列分析發(fā)現(xiàn),用戶(hù)行為多次瀏覽落地頁(yè),但瀏覽動(dòng)作重復(fù),隔一段時(shí)間進(jìn)行一次 落地頁(yè)訪(fǎng)問(wèn),行為也有重復(fù)。因此 M 渠道用戶(hù)的行為路徑存在太強(qiáng)的規(guī)律性,是有跡可循的,進(jìn)一步證實(shí)了是虛假流量。 ( 備注 : 一個(gè)循環(huán)單元中的兩個(gè)動(dòng)作間隔極短,不到 1s,應(yīng)該這兩個(gè)事件是一次瀏覽落地頁(yè)而觸發(fā)的神策預(yù)置采集的 Web 瀏覽事件和自定義事件頁(yè)面訪(fǎng)問(wèn),其實(shí)只是一個(gè)瀏覽落地頁(yè)的動(dòng)作 )。

三. 轉(zhuǎn)化情況終極確認(rèn)

目前有些作弊流量可以模仿人類(lèi)行為,繞過(guò)跳出率、平均訪(fǎng)問(wèn)深度和停留時(shí)長(zhǎng)這些宏觀指標(biāo),但是要模仿一個(gè)業(yè)務(wù)轉(zhuǎn)化就 比較難了,如果宏觀指標(biāo)表現(xiàn)很好,業(yè)務(wù)轉(zhuǎn)化很少的話(huà),就需要提高警覺(jué)。 根據(jù)實(shí)際業(yè)務(wù)流程,我們定義“提交訂單”是核心轉(zhuǎn)化。我們?cè)O(shè)置核心轉(zhuǎn)化漏斗步驟如下 :

圖12?設(shè)置核心轉(zhuǎn)化漏斗流程

圖13 M 渠道用戶(hù)與非 M 渠道用戶(hù)核心轉(zhuǎn)化對(duì)比

通過(guò)漏斗分析對(duì)比,可以看到 M 渠道用戶(hù)完成核心轉(zhuǎn)化的用戶(hù)數(shù)為 0。在漏斗轉(zhuǎn)化中,我們發(fā)現(xiàn)當(dāng)用戶(hù)訪(fǎng)問(wèn)頁(yè)面訪(fǎng)問(wèn)后, 并沒(méi)有用戶(hù)去點(diǎn)擊核心按鈕“提交訂單”,更是沒(méi)有有效點(diǎn)擊的用戶(hù)。M 渠道雖然給平臺(tái)帶來(lái)了很大流量,但是核心轉(zhuǎn)化的 人數(shù)為 0,對(duì)于我們核心業(yè)務(wù)并無(wú)幫助。再結(jié)合用戶(hù)在網(wǎng)站中的參與度與行為分析,該流量符合我們判斷虛假流量的常見(jiàn) 特征。

通過(guò)神策分析平臺(tái)進(jìn)行的上述分析,我們通過(guò)對(duì) M 渠道流量產(chǎn)生的時(shí)間、流量的用戶(hù)終端、流量的跳出率、退出率、平均 訪(fǎng)問(wèn)時(shí)長(zhǎng)、平均訪(fǎng)問(wèn)深度、用戶(hù)路徑以及流量的核心轉(zhuǎn)化等方面進(jìn)行分析,可以發(fā)現(xiàn),該批流量在流量分布上呈現(xiàn)不自然性、 過(guò)于規(guī)律的特點(diǎn),基本判斷 M 渠道產(chǎn)生的流量為虛假流量。

總結(jié)

面對(duì)虛假流量我們應(yīng)該做什么?數(shù)據(jù)分析是識(shí)別虛假流量的重要方式之一。除此之外,一些企業(yè)也嘗試通過(guò)邏輯判斷設(shè)定相應(yīng)機(jī)制,來(lái)輔助識(shí)別虛假流量。 例如一家企業(yè)在 APPStore版本更新時(shí),如果發(fā)版的第二天新增用戶(hù)為老版本,那么這部分群體將自動(dòng)被判定為疑似虛假 流量,并對(duì)其屏蔽相關(guān)功能,如默認(rèn)福利、私信等,當(dāng)然還會(huì)提供用戶(hù)申訴解封的途徑,以防誤判。

無(wú)論通過(guò)哪種方式,虛假流量都被證明為并非無(wú)跡可尋。其中數(shù)據(jù)分析是識(shí)別虛假流量相對(duì)直接且簡(jiǎn)單的識(shí)別途徑,為廣 告主為提升數(shù)字營(yíng)銷(xiāo)運(yùn)營(yíng)能力。這要求企業(yè)主:

一方面,要掌握可靠的衡量數(shù)據(jù)。依據(jù)對(duì)數(shù)據(jù)分析工具的熟稔應(yīng)用以及監(jiān) 測(cè)執(zhí)行經(jīng)驗(yàn),企業(yè)應(yīng)與能夠?qū)崿F(xiàn)多維數(shù)據(jù)分析平臺(tái)進(jìn)行合作,神策數(shù)據(jù)幫助企業(yè)對(duì)疑似流量進(jìn)行精細(xì)維度的排查,輔助網(wǎng) 絡(luò)投放環(huán)境的凈化;

另一方面,廣告主應(yīng)不斷優(yōu)化運(yùn)營(yíng)模式與改善運(yùn)營(yíng)狀況,虛假流量的監(jiān)測(cè)與識(shí)別并非高度依靠技術(shù)能力, 廣告主在理解虛假流量特征后,可通過(guò)基礎(chǔ)數(shù)據(jù)分析專(zhuān)業(yè)知識(shí),評(píng)估數(shù)字廣告投放效果,不斷優(yōu)化投放渠道。

相關(guān)閱讀

虛假流量的認(rèn)知與識(shí)別(上篇)

 

作者:張喬,神策數(shù)據(jù)內(nèi)容營(yíng)銷(xiāo)負(fù)責(zé)人。公眾號(hào):神策數(shù)據(jù)

本文由 @張喬 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App