虛假流量的認(rèn)知與識(shí)別(上篇)
接下來(lái)兩篇文章都是針對(duì)虛假流量的識(shí)別,上篇圍繞虛假流量的發(fā)生機(jī)制、發(fā)生原因(背后的利益捆綁)、識(shí)別虛假流量的常見(jiàn)維度等;下篇從一個(gè)案例完整介紹如何識(shí)別虛假流量。
電商、支付平臺(tái)、O2O、自媒體、廣告等行業(yè)無(wú)一例外地充斥著虛假流量,不同行業(yè)的流量作弊形式不同。對(duì)廣告主來(lái)說(shuō), 了解廣告投放過(guò)程中虛假流量的作弊形式和獲益形式,是識(shí)別虛假流量的基礎(chǔ)與前提。
圖?1 各行業(yè)虛假流量的形式
一、看似正常的廣告投放的環(huán)節(jié)
一般而言,廣告投放過(guò)程包含這樣幾個(gè)環(huán)節(jié):
- 第一步,廣告主選擇投放哪種廣告,常見(jiàn)的形式包括 SEM、DSP、信息流、開(kāi)屏廣告等;
- 第二步,確認(rèn)廣告的付費(fèi)形式,常見(jiàn)的廣告付費(fèi)形式有 CPM、CPC、CPA、CPS 為主要的結(jié)算方式,分別按照展示量、點(diǎn)擊量、 轉(zhuǎn)化量、銷售額結(jié)算;
- 第三步,跟蹤廣告的投放數(shù)據(jù),常見(jiàn)的投放數(shù)據(jù)有展現(xiàn)量、點(diǎn)擊率、點(diǎn)擊量、消費(fèi)、成功注冊(cè)量、下載量等。
由于廣告投放過(guò)程中渠道服務(wù)商存在各級(jí)代理,存在流量獲取的透明度不高的問(wèn)題,讓可供作弊的灰色區(qū)域越來(lái)越多。
圖 2??廣告投放流程
二、虛假流量的發(fā)生機(jī)制及獲益形式
看似正常的廣告投放流程,其實(shí)隱藏著虛假流量的危機(jī)。站在廣告主的角度,我們從兩個(gè)方向去解讀虛假流量:
- 第一種是 虛假流量的“發(fā)生機(jī)制”;
- 第二種是虛假流量的“獲益形式”。
1. 虛假流量的發(fā)生機(jī)制:機(jī)器作弊 + 人為作弊
圖?3 機(jī)器作弊 & 人為作弊
“機(jī)器作弊”常見(jiàn)的手段有,通過(guò)機(jī)器發(fā)送虛假流量、肉機(jī)訪問(wèn)網(wǎng)頁(yè)、修改 DNS/IP 訪問(wèn)網(wǎng)頁(yè)、爬蟲(chóng)技術(shù)訪問(wèn)網(wǎng)頁(yè)等手段來(lái) 制造虛假流量,目的是模擬瀏覽行為產(chǎn)生大量瀏覽痕跡或點(diǎn)擊和實(shí)現(xiàn)流量增加,機(jī)器作弊的成本相對(duì)較低,但都離不開(kāi)代碼程序。
目前較好的預(yù)防措施,是通過(guò)基礎(chǔ)的用戶行為分析來(lái)識(shí)別此類虛假流量,再通過(guò)補(bǔ)量、屏蔽的方法來(lái)減少此類虛假流量。 例如:頻繁更換用戶身份,在一個(gè) cookie 身上猛薅羊毛,一個(gè)用戶有成千上萬(wàn)次展示;
再如:iframe 造假展示也是常用方式,iframe 是一個(gè) HTML 標(biāo)簽,常常被用來(lái)作為承載展示廣告的載體,作弊可以通過(guò)將 iframe 的尺寸改為肉眼無(wú)法識(shí)別的圖片。但這畢竟算一次曝光,廣告主會(huì)要向此付費(fèi),實(shí)際上用戶并未看到。
“人為作弊”場(chǎng)景的手段有,通過(guò)雇傭、激勵(lì)的方式雇傭大批人員去點(diǎn)擊廣告、下載 APP、訪問(wèn)網(wǎng)頁(yè),因?yàn)閷儆谌藶椴僮鳌?/p>
這類虛假流量較難屏蔽,但成本相對(duì)較高。可通過(guò)深度用戶行為分析,如轉(zhuǎn)化情況來(lái)識(shí)別此類虛假流量,并提高“人為作弊” 的運(yùn)營(yíng)成本來(lái)減少此類虛假流量。
2.?虛假流量的獲益形式
圖?4 虛假流量的獲益形式
提到虛假流量的獲益形式,就離不開(kāi)上文提到的廣告付費(fèi)形式。每種廣告都會(huì)有對(duì)應(yīng)的結(jié)算和考核指標(biāo),這就成為虛假流量作假的痛點(diǎn)之一。
- CPM、CPC 付費(fèi)形式的作弊場(chǎng)景主要為刷廣告指標(biāo),如:曝光、點(diǎn)擊等。
- CPA 付費(fèi)形式的作弊場(chǎng)景是刷下載、激活及留存等。
- CPS 付費(fèi)形式的作弊場(chǎng)景是刷訂單。
每種廣告都有對(duì)應(yīng)的付費(fèi)形式,每種付費(fèi)形式都有虛假流量獲益的訴求點(diǎn),這些組成了虛假流量獲益的形式。這些虛假流量的出現(xiàn),通常帶有明顯特點(diǎn),比如:點(diǎn)擊變得很頻繁但無(wú)有效交互、一段時(shí)間內(nèi)同一個(gè)人頻繁訪問(wèn)投放的廣告等。
三、虛假流量的“生態(tài)圈”下的利益捆綁
虛假流量之所以能成為“生態(tài)圈”,是因?yàn)楣┬桦p方有著共同的利益。在這個(gè)“生態(tài)圈”中,虛假流量的提供者、虛假流量 的獲取者是兩個(gè)重要角色。
1. 虛假流量的提供者:媒體與廣告平臺(tái)的利益捆綁
廣告平臺(tái)和媒體是虛假流量的提供者,兩者掌握著大量的流量資源。
- 媒體廣告平臺(tái)媒體廣告平臺(tái)是廣告流量的源頭,也是廣告投放鏈條中收益最大的一方,每年中國(guó)在營(yíng)銷廣告的投放已經(jīng)有數(shù)百億元。日益增加的廣告投放需求與流量需求,不停推動(dòng)著廣告平臺(tái)自身對(duì)流量擴(kuò)增的需求,這樣虛假流量也就隨之出現(xiàn)了。
- 廣告服務(wù)商:廣告服務(wù)商,作為廣告主與廣告平臺(tái)的橋梁,是廣告投放鏈路中重要的環(huán)節(jié),廣告服務(wù)商與廣告主達(dá)成協(xié)議去完成其要求 的 KPI 業(yè)績(jī),若無(wú)法完成 KPI,虛假流量也會(huì)成為實(shí)現(xiàn) KPI 業(yè)績(jī)的一種手段,例如:想盡辦法創(chuàng)造下載量、訪問(wèn)量、閱讀量等。
2. 虛假流量的獲取者:“KPI”壓力下的無(wú)奈與默許
在一定程度上,廣告主很容易成為虛假流量的“推動(dòng)者”,例如在以下場(chǎng)景中:
- 面對(duì)考核指標(biāo)的壓力:當(dāng)企業(yè)(廣告主)過(guò)分追求 KPI 以及某些效果指標(biāo)的時(shí)候,基于考核指標(biāo)的壓力會(huì)越來(lái)越大,當(dāng)曝光、 點(diǎn)擊等指標(biāo)無(wú)法完成時(shí),不自覺(jué)地會(huì)忽視廣告刷量的影響。
- 投放價(jià)格低:歸因分析能夠幫助企業(yè)判別最終轉(zhuǎn)化源自哪個(gè)渠道(或哪些渠道對(duì)轉(zhuǎn)化有積極影響),而企業(yè)經(jīng)常會(huì)忽略這一功能。常見(jiàn)的原因是當(dāng)投放預(yù)算充足、獲客情況滿足 KPI 的情況下,企業(yè)的營(yíng)銷運(yùn)營(yíng)會(huì)忽略不同渠道存在的虛假流量。而有些渠道的流量真假參半,若不去追溯每個(gè)渠道流量質(zhì)量,就會(huì)縱容虛假流量對(duì)營(yíng)銷效果的長(zhǎng)期影響。這對(duì)于以效果為目標(biāo)的營(yíng)銷最為重要,尤其在年度復(fù)盤(pán)的時(shí)候,才發(fā)現(xiàn)損失也不是一個(gè)小數(shù)目。
- 企業(yè)融資需求:一些創(chuàng)業(yè)公司為了把下載量等數(shù)據(jù)做得好看,吸引更多的投資,也會(huì)主動(dòng)用虛假流量的方式刷單。
3.?高利潤(rùn)、低風(fēng)險(xiǎn)助長(zhǎng)雙方流量作弊
虛假流量并無(wú)高深的技術(shù)含量,且流量造假成本極低。相關(guān)數(shù)據(jù)顯示:刷流量的成本不及正常流量成本的十分之一。
廣告主對(duì)流量質(zhì)量的評(píng)估,除了發(fā)布方提供的報(bào)告外,無(wú)直接證據(jù)證明對(duì)方造假,因此追究虛假流量難度大,維權(quán)較為困難。
四、識(shí)別虛假流量的難點(diǎn)
為識(shí)別虛假流量,廣告主會(huì)因以下兩個(gè)問(wèn)題而犯難:
1.?廣告投放數(shù)據(jù)與網(wǎng)頁(yè)轉(zhuǎn)化數(shù)據(jù)斷層,無(wú)法判斷后續(xù)轉(zhuǎn)化情況
廣告投放數(shù)據(jù)與網(wǎng)頁(yè)轉(zhuǎn)化數(shù)據(jù)斷層是信息不透明的重要原因。
什么是廣告媒體數(shù)據(jù)?
前文提到,虛假流量會(huì)針對(duì)曝光和點(diǎn)擊數(shù)據(jù)做假,這兩個(gè)數(shù)據(jù)就屬于廣告媒體數(shù)據(jù)。
什么是轉(zhuǎn)化數(shù)據(jù)?
當(dāng)流量來(lái)到網(wǎng)站后就成為了訪客,訪客在網(wǎng)站完成交互(如:L注冊(cè)、有效呼起、下載等)可以認(rèn)定為線索, 這就是轉(zhuǎn)化數(shù)據(jù)。 廣告媒體數(shù)據(jù)與轉(zhuǎn)化數(shù)據(jù)斷層,也就是通常說(shuō)的前后端流量數(shù)據(jù)割裂。
這種情況下,一旦轉(zhuǎn)化率下降,廣告主將無(wú)法判斷 是投放策略問(wèn)題還是虛假流量作怪。 廣告主只能統(tǒng)計(jì)到前端的點(diǎn)擊轉(zhuǎn)化,不知道后續(xù)業(yè)務(wù)轉(zhuǎn)化如何,廣告主不能獲得用戶的詳細(xì)信息,就很容易被廣告平臺(tái)所 蒙蔽,盡管對(duì)廣告平臺(tái)的流量有所懷疑,也沒(méi)有明確的作弊證據(jù)。
2. 無(wú)法判斷虛假流量渠道,并進(jìn)行規(guī)避
無(wú)論是哪種轉(zhuǎn)化行為(注冊(cè)、呼起、下載、激活等)都離不開(kāi)流量渠道,更多時(shí)候轉(zhuǎn)化行為是由多個(gè)流量渠道共同承擔(dān)的。
當(dāng)全部流量混在一起的時(shí)候,即使你知道有虛假流量存在,也無(wú)法準(zhǔn)確定位是哪一個(gè)渠道帶來(lái)的虛假流量。
五、全流程數(shù)據(jù)流量監(jiān)控是識(shí)別的基礎(chǔ)
無(wú)論從哪個(gè)維度入手,識(shí)別虛假流量,需要將流量數(shù)據(jù)、行為數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)通過(guò)一定的數(shù)據(jù)采集手段,來(lái)獲取完整、全 面和準(zhǔn)確的數(shù)據(jù),目的是實(shí)現(xiàn)全流程數(shù)據(jù)流量的跟蹤與分析。只有獲取了完整全面的數(shù)據(jù),我們才能找到虛假流量的蹤跡,只分析一個(gè)虛假流量環(huán)節(jié),不足以支撐虛假流量的證據(jù)。
下圖是流量轉(zhuǎn)化的完整過(guò)程:為方便大家理解什么是“全流程數(shù)據(jù)流量”,可見(jiàn)下圖:
圖?5?全流程數(shù)據(jù)流量
六、識(shí)別虛假流量的常見(jiàn)維度
一般來(lái)說(shuō),真實(shí)流量一般自然 (真實(shí)的流量在各個(gè)維度中表現(xiàn)一定是自然的)與多樣(網(wǎng)民的喜好各不相同,行為一定也是 多樣的)。而對(duì)于虛假流量,常表現(xiàn)出一定的目的性(虛假流量的產(chǎn)生一定和某個(gè)特定的目的有關(guān))和規(guī)律性(特定的目的導(dǎo)致虛假流量一定有特殊的規(guī)律)。
由于虛假流量與真實(shí)流量在具體訪問(wèn)行為有較大差異,圍繞用戶行為可從以下幾方面識(shí)別出虛假流量。
圖?6?識(shí)別虛假流量的常見(jiàn)維度
1.?基本屬性
具體包括:時(shí)間 & 地域維度、終端類型、操作系統(tǒng)、聯(lián)網(wǎng)方式、運(yùn)營(yíng)商、IP 集中等。
- 時(shí)間維度 & 地域維度:正常的流量訪問(wèn)分布在一天中的各個(gè)時(shí)段、地理分布較為均勻(區(qū)域性投放或者活動(dòng)除外)、訪問(wèn)趨勢(shì)較為平緩。而不同流量出現(xiàn)時(shí)間段特殊、來(lái)源區(qū)域集中、趨勢(shì)突增的情況。因此,通過(guò)流量產(chǎn)生的時(shí)間、地理位置、訪問(wèn)趨勢(shì)變化都可以成為判斷虛假流量的參考方式。
- 終端類型:不同的渠道覆蓋不同的用戶群,用戶終端會(huì)有一定的區(qū)別。比如:小米應(yīng)用商店渠道的用戶,十之八九手機(jī)是小米手機(jī),如果對(duì)方是中國(guó)移動(dòng)的客戶,他們則來(lái)自于移動(dòng)運(yùn)營(yíng)商。排除這些特殊渠道的應(yīng)用商店,大部分渠道的用戶終端跟整個(gè)互聯(lián) 網(wǎng)終端分布是類似的。因此在正常情況下,用戶訪問(wèn)設(shè)備應(yīng)該多元化。同理,用戶的設(shè)備操作系統(tǒng)、聯(lián)網(wǎng)方式、運(yùn)營(yíng)商等設(shè)備屬性,同樣可以成為判斷虛假流量的參考標(biāo)準(zhǔn)。
2. 產(chǎn)品參與度
具體包括跳出率、平均訪問(wèn)深度、平均訪問(wèn)時(shí)長(zhǎng)、用戶行為路徑、頁(yè)面點(diǎn)擊情況、流量留存情況、單頁(yè)面人均訪問(wèn)次數(shù)等。
(1)跳出率
我們通常通過(guò)跳出率來(lái)衡量網(wǎng)站性能與質(zhì)量等,跳出率也可以作為辨別虛假流量的參考指標(biāo)。如果跳出率過(guò)高,我們除了要判斷投放渠道的質(zhì)量和定位客戶群體是否精準(zhǔn)外,還應(yīng)該警惕虛假流量。
(2)平均訪問(wèn)深度
訪問(wèn)深度是用戶一次瀏覽網(wǎng)站、APP 的深度,它是衡量網(wǎng)站服務(wù)效率的重要指標(biāo)之一。以刷量為目的的虛假流量,用戶訪 問(wèn)深度通常非常低。當(dāng)然,造成用戶訪問(wèn)深度不夠的原因有多種,如:新投放的落地頁(yè)的失敗引導(dǎo)等。
因此我們?cè)谟^察此指標(biāo)時(shí), 應(yīng)率先排除產(chǎn)品較大改動(dòng)造成的訪問(wèn)深度不足等特殊情況,或者與其他渠道的流量數(shù)據(jù)綜合比較,進(jìn)行科學(xué)評(píng)估。
(3)平均訪問(wèn)時(shí)長(zhǎng)
平均訪問(wèn)時(shí)長(zhǎng)指標(biāo),主要用來(lái)衡量用戶與網(wǎng)站、APP 交互的深度。交互越深,相應(yīng)停留的時(shí)長(zhǎng)也越長(zhǎng)。顯然虛假流量追求 的是“量”,而非“時(shí)長(zhǎng)”,因此平均訪問(wèn)時(shí)長(zhǎng)也可以配合幾個(gè)網(wǎng)站參與度指標(biāo)一起分析。
(4)用戶行為路徑
用戶在 APP 或網(wǎng)站中的訪問(wèn)行為路徑,用戶路徑的分析模型可以將用戶行為進(jìn)行可視化展示。因此通常用戶通過(guò)渠道來(lái)到 網(wǎng)站后會(huì)有不同的行為,他們一般會(huì)從落地頁(yè)開(kāi)始進(jìn)行分流,會(huì)訪問(wèn)不同的頁(yè)面,并在不同的頁(yè)面結(jié)束對(duì)網(wǎng)站的訪問(wèn)。
顯然, 用戶行為序列分布是沒(méi)規(guī)律的,而對(duì)于虛假流量,雖然通過(guò)某些方式完成 2-3 次點(diǎn)擊,但也是預(yù)先設(shè)定,有跡可循的。
(5)頁(yè)面點(diǎn)擊情況
虛假流量用戶的頁(yè)面點(diǎn)擊通常是不點(diǎn)擊,或者雜亂點(diǎn)擊的,借助熱力圖工具可以較為容易地發(fā)現(xiàn)問(wèn)題。
(6)留存情況
留存可以判斷用戶忠誠(chéng)度,真實(shí)的流量總會(huì)有一部分訪問(wèn)者會(huì)再次訪問(wèn),而虛假流量在合作結(jié)束后是不會(huì)進(jìn)行這些收尾工作的。
(7)流量的單頁(yè)面人均訪問(wèn)次數(shù)
如果某個(gè)落地頁(yè)面的人均訪問(wèn)次數(shù)很高,比如:4 次以上的話,就很可疑了,因?yàn)樵谝淮卧L問(wèn)中用戶一般是不會(huì)多次瀏覽同一 個(gè)落地頁(yè)的。結(jié)合該頁(yè)面在網(wǎng)站整體的人均訪問(wèn)次數(shù)進(jìn)行對(duì)比,結(jié)果會(huì)更加準(zhǔn)確。
3.?轉(zhuǎn)化情況
很多作弊流量可以模仿人類行為,成功繞過(guò)跳出率、平均訪問(wèn)深度和停留時(shí)長(zhǎng)這些宏觀指標(biāo),但是要模仿一個(gè)業(yè)務(wù)轉(zhuǎn)化就 比較難了,如果宏觀指標(biāo)表現(xiàn)很好,業(yè)務(wù)轉(zhuǎn)化很少的話,就需要提高警覺(jué)。
下篇將從用戶行為數(shù)據(jù)講述如何多維度診斷虛假流量。
作者:張喬,神策數(shù)據(jù)內(nèi)容營(yíng)銷負(fù)責(zé)人。公眾號(hào):神策數(shù)據(jù)
本文由 @張喬 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議