模型在風控策略中用到什么細節(jié)?
編輯導語:風控一般包含很多類型的規(guī)則,每個規(guī)則都是結(jié)合產(chǎn)品、業(yè)務(wù)基于經(jīng)驗和數(shù)據(jù)分析產(chǎn)生出來的,模型在風控中也有很大的作用;本文作者分析了模型在風控策略里有什么使用細節(jié),我們一起來看一下。
模型:通過歷史樣本數(shù)據(jù),運用數(shù)學算法,預測未來;我們通用的信用模型a卡就是根據(jù)客戶的申請數(shù)據(jù)字段,然后在權(quán)重上通過算法計算出來的系數(shù)的組合,得到相應(yīng)的預測概率(0-1之間),這就是最初的模型——它代表的是預測客戶發(fā)生逾期的概率,模型評分卡只是方便管理而轉(zhuǎn)化來的。
策略:即為了目標的實現(xiàn),通過一系列的規(guī)則組合,而成為策略。
所以風控會出現(xiàn)有很多的名詞:因子、規(guī)則、規(guī)則集、策略、策略集、事件等等。
風控最基本的因素是因子,因子構(gòu)成規(guī)則,多個功能相似的屬性規(guī)則組成規(guī)則集,多個規(guī)則集再成為策略;例如反欺詐策略,準入策略、額度策略、模型策略,這些組合成策略集,而整個策略集構(gòu)成了風控的一個貸前審核事件。
大概介紹了風控相關(guān)的一些概念,那模型在風控屬于什么位置呢?
其實可以理解模型就是一個因子,他可以單作為一條規(guī)則,成為只有一個規(guī)則的規(guī)則集,一個策略集,一個事件;有伙伴們問規(guī)則、模型、策略,都是具體怎么使用的,怎么組合的,規(guī)則和模型的區(qū)別等等,熟悉上面的邏輯就大概清晰了。
另一個模型之所以在風控中的有著重要地位,是由于模型通過多個規(guī)則因子(也就是蘊含了更多的規(guī)則)組合而來,它代表一系列規(guī)則因子的風險預測能力;所以它比任何一條規(guī)則都具有很好的區(qū)分度,所以模型這個單一的因子,生成單一的規(guī)則,比起其他簡單規(guī)則在風控中的地位高了很多。
話說回來,模型概率或分數(shù)在風控里回歸到一個因子,如何具體應(yīng)用呢?
一、選擇cutoff,即決策點
(模型決策表)
這個圖是根據(jù)模型衍生出的風控策略決策表,當我們的模型做出來了,我們是怎么選擇cutoff呢?
假如這個模型是做了拒絕演繹的模型,代表全部樣本的分布評分;我們先看bin_pdrate 從逾期78.57%單調(diào)下降到1.85%,模型的單調(diào)性很完美,ks為23,bin_rate是箱占比,整體上還是很正態(tài)分布的。
重要的我們看后兩列,這兩列是通過前幾列計算的在每個閾值點下的通過率和對應(yīng)的壞賬率,隨著通過率的降低,壞賬也隨著降低。
風控往往有幾個KPI考核指標,如壞賬率;如果KPI不能大于7,我們選擇了大于680分,30.16%的通過率,這是一個簡單的選擇。
有的公司會復雜的計算每一行的盈利情況,然后根據(jù)盈利來決定cutoff選擇哪一個。
方法多種,有的可能30%的通過率達不到KPI,會選擇630-680之間的一部分客戶進行人工審核、信審,或者再利用其它的數(shù)據(jù)模型進行撈回,下面講下?lián)苹氐牟呗允侨绾问褂媚P偷摹?/p>
二、模型撈回之提高通過率,精細化風險評估
撈回就是被模型拒絕的一些相對不差的客戶用其它有區(qū)分度的模型進行再次評估,達到提高通過率的效果。
(模型矩陣表)
拿我們常用的模型矩陣來說,這個與分群建模的思路是一樣的,上圖(圖中數(shù)據(jù)非真實模擬)中是通過矩陣壞賬的比例高低然后給與不同的額度。
在申請分660-679之中,我們通過芝麻分可以更好的再區(qū)分這個區(qū)間的人群風險,做到精細化管理,在申請分660-679中我可以選擇芝麻分在大于680,額度為大于10000的的客戶進行放款;因為這部分客戶的模型風險跟申請分大于680的同顏色的相同,這樣就可以根據(jù)模型矩陣來提高通過率。
三、多模型補漏之更合理地選擇客戶
(模型補漏策略)
在實際場景中,我們還會遇到另一種情況,就是我們模型的數(shù)據(jù)不是完全覆蓋的,有一定的缺失,一定的查得率,這時候往往不是一個模型可以解決問題的;因為你不能因為沒有數(shù)據(jù)而拒絕,這時候往往需要過多個模型進行互相補漏。
也就是說,如果有5個備用模型,在很大概率是可以決策任何一個用戶的借貸情況,模型的數(shù)據(jù)源越多,就可以覆蓋越多的客群,更大化的對客戶進行合理的風險評估。
例如第一個模型A沒有數(shù)據(jù),則運行模型B,按順序依次調(diào)??;一般模型運用策略是最好的,覆蓋最高的放在前面。
四、多模型組合使用之整體風險穩(wěn)定
(模型組合表)圖表模型名稱敏感用字母替換
這個風控模型不僅可以作為模型A-B Test使用,來測試新模型的效果(此表同時跑了8模型,每個模型分配不同的流量),然后對測試模型進行效果評估。
另外,通過長時間的工作經(jīng)驗積累,還可以將幾個有區(qū)分度的模型分流組合使用,整體效果會更好;原因主要是數(shù)據(jù)的穩(wěn)定性、數(shù)據(jù)的衰減性、市場等,往往多模型組合較單個模型使用,具有更穩(wěn)定的數(shù)據(jù)表現(xiàn)和更好的理想效果。
并不是我們認為模型A是最好的,然后就全部流量給A,因為都給A會存在很大的不確定性;例如數(shù)據(jù)源停供、數(shù)據(jù)源出現(xiàn)失真、數(shù)據(jù)源預測質(zhì)量明顯下降;這些現(xiàn)象,在實際工作中是經(jīng)常遇到的,事后發(fā)現(xiàn)就有些晚了。
反過來,通過幾個較好模型的組合,會發(fā)現(xiàn)有更穩(wěn)定、更理想的數(shù)據(jù)表現(xiàn),圖中無淘寶模型用了5個模型進行組合。
五、模型日志的的重要性
(模型日志)
上文是簡要的一個模型使用變動的所有記錄日志,這個一定要重視起來;我們工作中有很多需要回溯的時間,或者風控表現(xiàn)滯后,往往再排查原因不能準確的定位,就比較浪費時間了,最后還可能找不到原因。
假如今天客群表現(xiàn)很差,我提前知道某天前改動了模型的閾值,正好今天有表現(xiàn),這時候往往會很快的定位。
數(shù)據(jù)風險的變動無外乎兩種,外部的客群和內(nèi)部的風控,風控日志的每個變動都會帶來風險的變動。
所以找任何原因從日志上下手是最方便的,他就像我們寫代碼的log日志,很好很方便,也很需要,直接告訴你病點在哪。
以上是模型具體使用的一些細節(jié),在如何選擇決策點、模型撈回、模型補漏、模型組合、模型日志上進行具體的風控實施。
希望可以給讀者在思路的一些幫助與完善,謝謝!
本文由 @FAL金科應(yīng)用研院 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 unsplash,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!