互金風(fēng)控中的數(shù)據(jù)定義及應(yīng)用

1 評論 8065 瀏覽 45 收藏 9 分鐘

文章簡單的介紹了下風(fēng)控?cái)?shù)據(jù)定義和風(fēng)控?cái)?shù)據(jù)實(shí)踐,希望能夠給你帶來一些幫助。

金融的核心是風(fēng)控,風(fēng)控的核心是數(shù)據(jù),以上兩點(diǎn)基本得到了共識,尤其在消費(fèi)金融無抵押的現(xiàn)金貸領(lǐng)域更是被推崇到了極致,但到底用什么數(shù)據(jù),為什么用這些數(shù)據(jù),怎么用這些數(shù)據(jù),確是各有各的主張和看法。經(jīng)過了一段時間的思考,小編在這里給大家分享下自己的看法。

關(guān)于金融風(fēng)控?cái)?shù)據(jù)的的應(yīng)用思路,主要過程如下圖所示:

主要分為兩個階段:第一個階段為數(shù)據(jù)定義,第二個階段主要為數(shù)據(jù)實(shí)踐。為什么要這樣分呢?

其實(shí)這也是小編走過了一些彎路后才發(fā)現(xiàn)的。一般情況下而言,很多時候,迫于業(yè)務(wù)或者公司上線的時間性要求,會根據(jù)經(jīng)驗(yàn)或甚至拍腦袋就直接進(jìn)入數(shù)據(jù)實(shí)踐的階段,而略過了第一個階段數(shù)據(jù)定義的過程,這樣做的后果往往導(dǎo)致在數(shù)據(jù)應(yīng)用環(huán)節(jié)顧此失彼,不知所然,甚至經(jīng)常要推倒重來。發(fā)生這種情況的原因多數(shù)在于不知道數(shù)據(jù)定義的重要性和綱領(lǐng)性。以下小編將按照兩個階段簡要分析下數(shù)據(jù)風(fēng)控的應(yīng)用思路。

數(shù)據(jù)定義階段

該階段主要解決的問題是戰(zhàn)略性問題,回答諸如什么業(yè)務(wù),什么用戶,什么數(shù)據(jù),什么場景這類根本性問題。這些問題為風(fēng)控?cái)?shù)據(jù)的實(shí)踐提供根本意義上的綱領(lǐng)性指導(dǎo)。

  1. 定義業(yè)務(wù) 此項(xiàng)主要是回答業(yè)務(wù)定位,諸如現(xiàn)金貸領(lǐng)域,其業(yè)務(wù)特性是小額、短期、無抵押、線上借貸。這種業(yè)務(wù)特性決定了現(xiàn)金貸的風(fēng)控業(yè)務(wù)特性是主要考察還款意愿和欺詐風(fēng)險(xiǎn),而鑒于還款意愿的難以量化性,因此基本上重點(diǎn)就放在了欺詐風(fēng)險(xiǎn)的考察。
  2. 定義用戶 此項(xiàng)主要回答用戶定位,現(xiàn)金貸的用戶是那些有經(jīng)常性有急需小額現(xiàn)金需求,有一定收入來源,但無足夠的資信在銀行獲得貸款的人。這種用戶決定了現(xiàn)金貸的風(fēng)控?cái)?shù)據(jù)必不同于傳統(tǒng)銀行業(yè)務(wù)的做法,去讓用戶填大量的資料。
  3. 定義數(shù)據(jù) 此項(xiàng)主要回答用那些數(shù)據(jù),基于之前的業(yè)務(wù)和用戶定位,數(shù)據(jù)的重點(diǎn)就在于確定用戶是真實(shí)的借款用戶。
  4. 定義場景 此項(xiàng)主要回答數(shù)據(jù)怎么用的問題,同樣基于業(yè)務(wù)特性和用戶特性,我們會發(fā)現(xiàn)數(shù)據(jù)基本上用在核實(shí)用戶是該用戶,給予用戶額度,給予用戶準(zhǔn)入,用戶是否是真的借款用戶而非惡意欺詐,用戶額度調(diào)整,貸款審核策略,貸款回收策略等場景。

數(shù)據(jù)實(shí)踐階段

當(dāng)晚餐數(shù)據(jù)定義階段的事宜后,我們明白了是什么和為什么,基本上后面怎么做的問題也就回答了一半。

1)數(shù)據(jù)采集 根據(jù)用戶定義和數(shù)據(jù)定義,我們知道了要用新的數(shù)據(jù)采集方法,減少用戶輸入,也知道了數(shù)據(jù)的重點(diǎn)在于核實(shí)用戶借款目的的真實(shí)性。

因此我們就會利用現(xiàn)代科技手段,或通過與三方數(shù)據(jù)機(jī)構(gòu)或征信機(jī)構(gòu)合作,通過用戶的簡單授權(quán),或僅僅提供一個關(guān)鍵信息,然后我們在用戶授權(quán)的前提下去獲取到用戶的身份信息,用戶的設(shè)備信息,用戶的聯(lián)系信息,用戶的收入信息,用戶的社交信息,用戶的電商信息,及其它的能夠獲取到的信息。

2)整理存儲 數(shù)據(jù)獲取后我們將用戶的數(shù)據(jù)按照結(jié)構(gòu)化的加工存儲方法進(jìn)行加工和整理,使之具有較強(qiáng)可存儲性,可查找性,可辨識性。

然后按照結(jié)構(gòu)化的方式進(jìn)行存儲,一般來講,存儲的技術(shù)策略是采用分布式存儲,這樣提高數(shù)據(jù)存儲的安全性。

3)加工分析 根據(jù)存儲的用戶,我們可以對數(shù)據(jù)進(jìn)行加工,當(dāng)然數(shù)據(jù)的加工也是以應(yīng)用場景和應(yīng)用目的為引導(dǎo)進(jìn)行的加工。

加工時機(jī)上有的是在數(shù)據(jù)采集之后就進(jìn)行的處理,有的是在數(shù)據(jù)存儲的時候進(jìn)行處理,但大多數(shù)的時候在數(shù)據(jù)應(yīng)用的時候進(jìn)行的處理。

加工的方法,有的是講非結(jié)構(gòu)化的數(shù)據(jù)做結(jié)構(gòu)化處理,有的是對數(shù)據(jù)進(jìn)行二次衍生數(shù)據(jù)的抽離,比如用戶的身份證號碼,提取出用戶的戶籍和生日,有的是數(shù)據(jù)的重新組合歸類等等。

這種數(shù)據(jù)加工的結(jié)果多數(shù)是形成一種數(shù)據(jù)反饋機(jī)制,這種反饋機(jī)制包括諸如用戶的額度授予,用戶的產(chǎn)品推薦,用戶的反欺詐,用戶的信用分授予等等,都是在對以往的數(shù)據(jù)進(jìn)行加工后形成了一種反饋機(jī)制。

4)數(shù)據(jù)的應(yīng)用 數(shù)據(jù)的應(yīng)用層面上,也就是主要基于要服務(wù)的場景,就所出現(xiàn)的問題,提供了一套解決方案。

我們通過對已獲取用戶數(shù)據(jù)的分析,分析大量的好客戶和壞客戶之后,就知道了好客戶和壞客戶的數(shù)據(jù)特征,這樣就基本上可以驗(yàn)證個人身份信息真實(shí)性,聯(lián)系信息真實(shí)性,收入信息真實(shí)性,設(shè)備信息真實(shí)性,社交信息真實(shí)性,電商信息真實(shí)性,其它應(yīng)用信息的真實(shí)性,欺詐歷史的存在性,當(dāng)然也有部分還款意愿的存在性等。

這種數(shù)據(jù)特征的設(shè)定和驗(yàn)證方法,有的是根據(jù)經(jīng)驗(yàn)法則,提前設(shè)定一套規(guī)則,符合標(biāo)準(zhǔn)的即為準(zhǔn)確,不符合標(biāo)準(zhǔn)的即為不合適,至于不確定部分,則依靠其它手段進(jìn)行驗(yàn)證。但限于規(guī)則是依賴于經(jīng)驗(yàn),不能夠?qū)π鲁霈F(xiàn)的現(xiàn)象進(jìn)行判定,而且存在查全率問題。

這就出現(xiàn)了風(fēng)控模型,通過設(shè)定一個算法模型,讓算法對歷史獲取的大量數(shù)據(jù)進(jìn)行分析,然后基于算法分析的結(jié)果來讓模型捕捉到好壞用戶的特征,并基于此對新來用戶進(jìn)行歸類,這種算法的模型設(shè)定和判定值得修訂也要根據(jù)數(shù)據(jù)表現(xiàn)不斷調(diào)整,使之符合相應(yīng)的業(yè)務(wù)目標(biāo)。

除了驗(yàn)證用戶真實(shí)性,借款用戶的真實(shí)性外,還可以根據(jù)用戶的不同特征進(jìn)行產(chǎn)品的推薦,人工審核的分級,催收分級,乃至通過數(shù)據(jù)表現(xiàn)進(jìn)行客戶的分層聚類,進(jìn)而采取不同的額度,審核方法,催收方法,等都是風(fēng)控領(lǐng)域數(shù)據(jù)的應(yīng)用。

以上簡單的介紹了下風(fēng)控?cái)?shù)據(jù)定義和風(fēng)控?cái)?shù)據(jù)實(shí)踐,主要結(jié)合現(xiàn)金貸領(lǐng)域的應(yīng)用,至于其它領(lǐng)域也可以結(jié)合本篇進(jìn)行具體的分析。

 

本文由 @疾舟滄海 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自PEXELS,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!