專訪宜信高級(jí)副總裁、大數(shù)據(jù)負(fù)責(zé)人Joyce:當(dāng)金融遇上大數(shù)據(jù),能擦出什么火花?

2 評(píng)論 6810 瀏覽 7 收藏 20 分鐘

這兩年,互聯(lián)網(wǎng)金融的成長(zhǎng)速度讓一些不可一世的傳統(tǒng)金融巨人也不禁打了個(gè)冷戰(zhàn)。倒不是因?yàn)榛ヂ?lián)網(wǎng)金融業(yè)務(wù)的規(guī)模真的威脅到了傳統(tǒng)金融,而是伴隨它而 來的這股創(chuàng)新力量讓傳統(tǒng)金融行業(yè)中存在的問題和局限性暴露無余。所幸,已經(jīng)有一些人開始意識(shí)到問題的緊迫性,當(dāng)然,還有問題背后所蘊(yùn)藏的巨大機(jī)遇。

Joyce Zhang 就是這些人中的一個(gè)。Joyce 是宜信 CEO 唐寧從美國(guó)挖來的一位資深大數(shù)據(jù)專家,現(xiàn)在擔(dān)任宜信大數(shù)據(jù)創(chuàng)新中心的 總經(jīng)理。在來宜信之前,Joyce 曾經(jīng)服務(wù)過 Hulu、Microsoft 等公司,主要負(fù)責(zé)的是基于大數(shù)據(jù)的推薦引擎、搜索平臺(tái)、廣告精準(zhǔn)投放等技術(shù)系統(tǒng)的開發(fā)。Joyce 說:“一直想做些跨界的事情,而金融與大數(shù)據(jù)結(jié)合后會(huì)有很多可能性,這些可能性讓我充滿期待?!?/p>

問題出在哪兒?

目前,互聯(lián)網(wǎng)金融的體量還非常小。以 P2P 網(wǎng)貸業(yè)務(wù)為代表,截至 11 月其規(guī)模為 2450 億,而傳統(tǒng)金融行業(yè)擁有的資產(chǎn)卻是百萬億的量級(jí)。雖然在規(guī)模上的沖擊幾乎可以忽略不計(jì),但這幾千億的背后卻是傳統(tǒng)金融不曾服務(wù)到的那些小微人群。當(dāng)金融開 始走向普惠,問題也隨之暴露出來。金融的本質(zhì)在于通過風(fēng)險(xiǎn)管理實(shí)現(xiàn)資本價(jià)值,可傳統(tǒng)金融的征信手法卻不能完全滿足互聯(lián)網(wǎng)金融業(yè)務(wù)的風(fēng)控需求,這既包括覆蓋 人群的局限,也包括風(fēng)控手段上的局限。我國(guó)缺失多年的社會(huì)信用體系正在加速現(xiàn)形。來看看下面幾點(diǎn):

1、在央行有征信記錄的人不足全國(guó)人口 1/4

按照央行最新數(shù)據(jù),目前央行征信系統(tǒng)中共有 8.4 億人,但其中有實(shí)際征信記錄的只有 3.2 億人。也就是說,全國(guó) 13 億多人口,有 5 億人在征信系統(tǒng)中只是一個(gè)身份證號(hào)碼,還有 5 億人完全不在系統(tǒng)內(nèi)。有征信記錄的人只占到全國(guó)人口數(shù)的 23.7%,遠(yuǎn)低于美國(guó)征信體系對(duì)人口的 85% 的覆蓋率。而在 P2P 蜂起之前,很多人并沒有注意到這件事。

2、央行征信中心的數(shù)據(jù)不是你想用就能用

目前,可以接入央行征信中心的金融機(jī)構(gòu)有銀行、持牌照的第三方征信服務(wù)商以及部分地區(qū)的小貸公司(第一批于 6 月在上海獲批),P2P 平臺(tái)尚沒有接入資格。這無疑將加大 P2P 平臺(tái)的風(fēng)控難度。不僅如此,P2P 平臺(tái)上的貸款人信息也不能被錄入央行征信系統(tǒng),各家 P2P 成了一個(gè)個(gè)信息孤島,他們手中信用數(shù)據(jù)的價(jià)值也得不到充分開發(fā)。

3、傳統(tǒng)征信手段存在諸多局限

在數(shù)據(jù)范疇上,傳統(tǒng)征信數(shù)據(jù)來自于借貸領(lǐng)域,最典型的就是信用卡消費(fèi)記錄,這就大大限制了征信數(shù)據(jù)的來源。 在征信思路上,傳統(tǒng)征信是用昨天的信用記錄來判斷今天的信用價(jià)值,這未見得就是最合理的思路。在征信技術(shù)上,傳統(tǒng)的方法是從線下采集信用數(shù)據(jù),即使在 P2P 網(wǎng)貸業(yè)務(wù)中,也只能暫時(shí)照搬這套方法。

來看看目前國(guó)內(nèi) P2P 平臺(tái)的征信邏輯:先考慮用戶的數(shù)據(jù)拼圖里需要哪些資料,能夠電子化獲取的就電子化,不能做到的,就讓用戶自主上傳,然后通過其他線上或線下手段驗(yàn)證。目前,以有利、積木盒子等為代表的與線下小貸公司或擔(dān)保公司合作的 P2B 網(wǎng)貸平臺(tái)更多是通過合作的小貸公司或擔(dān)保公司來獲取借貸人的征信數(shù)據(jù),主要是電話征信和實(shí)地考察征信,這都是傳統(tǒng)金融機(jī)構(gòu)的風(fēng)控方式,效率比較低。當(dāng)然,也有積極踐行線上征信的 P2P 平臺(tái),比如宜人貸、拍拍貸。可以說,傳統(tǒng)的線下征信技術(shù)限制了數(shù)據(jù)來源和信用評(píng)估思路,而互聯(lián)網(wǎng)的技術(shù)、工具和思維具備了改變這一切的可能性。

其實(shí),信用數(shù)據(jù)不僅僅是應(yīng)用在金融領(lǐng)域中,生活中各種涉及履約的場(chǎng)景都需要人們的信用數(shù)據(jù)。在一個(gè)成熟的信用社會(huì)中,人們的每一項(xiàng)商業(yè)行為都應(yīng)與他 的信用數(shù)據(jù)相掛鉤,從而形成一個(gè)信用數(shù)據(jù)的良性循環(huán)。也正因?yàn)槿绱?,很多在美?guó)做的風(fēng)生水起的商業(yè)模式搬到中國(guó)來卻無法成功,比如各種短租業(yè)務(wù),其核心問 題之一就是國(guó)內(nèi)缺乏一套完善的信用評(píng)估體系。

宜信“大數(shù)據(jù)金融”的玩法

當(dāng)金融遇上大數(shù)據(jù),這個(gè)缺失已久的信用體系有了搭建的可能性,這也是唐寧成立宜信大數(shù)據(jù)中心的初衷。Joyce 將宜信在大數(shù)據(jù)金融上的探索方向描述為“金融云平臺(tái)”。

顧名思義,這會(huì)是一個(gè)開放的平臺(tái)架構(gòu):既能支撐宜信自己的 P2P 業(yè)務(wù)(比如宜人貸、與 eBay 合作的商通貸),也能開放給其他生態(tài)合作伙伴,讓這個(gè)生態(tài)中的伙伴們共同建設(shè)、共同受益。

  • 金融知識(shí)圖譜是平臺(tái)的基礎(chǔ)

金融云平臺(tái)擁有一般云平臺(tái)的特點(diǎn):分布式存儲(chǔ)、分布式計(jì)算框架、虛擬化環(huán)境,但與一般的云平臺(tái)的差別在于,這是一個(gè)基于金融業(yè)務(wù)的云平臺(tái),其中必然包含特定的業(yè)務(wù)邏輯。宜信將風(fēng)控、反欺詐、獲客能力等核心的金融邏輯抽象出來,作為金融云平臺(tái)的內(nèi)核。

金融知識(shí)圖譜是平臺(tái)的基礎(chǔ),在這個(gè)基礎(chǔ)上能長(zhǎng)出很多應(yīng)用場(chǎng)景,比如獲客、實(shí)時(shí)授信、產(chǎn)品個(gè)性化推薦、貸后管理等。

知識(shí)圖譜這個(gè)概念最早是由 Google 提出的,是搜索引擎往下一階段演進(jìn)的過程中發(fā)展出來的。這其中包含兩個(gè)方面:實(shí)體的畫像,實(shí)體間的關(guān)系。

實(shí)體的畫像其實(shí)就是我們常說的“用戶畫像”,很好理解。而實(shí)體間的關(guān)系是 Joyce 特別強(qiáng)調(diào)的一點(diǎn)。原來做用戶畫像時(shí),畫像之間是彼此獨(dú)立的,但這并不符合現(xiàn)實(shí)生活中的場(chǎng)景:人并不是獨(dú)立存在的,人與環(huán)境中的萬物都是有關(guān)聯(lián)的。如果說每 個(gè)人是知識(shí)圖譜中的節(jié)點(diǎn),那么人與環(huán)境所形成的關(guān)系就是兩點(diǎn)間的線。當(dāng)把“點(diǎn)和線”綜合起來分析時(shí),我們對(duì)個(gè)人的性格特征、信用狀況、財(cái)富屬性都會(huì)有更深 層、更全面的理解。

  • 豐富的數(shù)據(jù)來源是平臺(tái)的養(yǎng)分

互聯(lián)網(wǎng)技術(shù)和工具的引入使得數(shù)據(jù)采集從線下逐漸轉(zhuǎn)移到了線上,也使得數(shù)據(jù)體量迅速變大。目前,宜信金融云平臺(tái)所采集的數(shù)據(jù)主要是以下幾類:

1、宜信已有的數(shù)據(jù)

宜信在 P2P 行業(yè)有 8 年積累,用戶已過百萬。實(shí)際上,只要與宜信有過接觸的用戶,不管是在哪個(gè)環(huán)節(jié)終止了接觸,都被視為宜信的重要數(shù)據(jù)資產(chǎn)。他們有的曾提交過信用報(bào)告、聯(lián)系人 信息、教育水平、工資單、銀行流水等一系列傳統(tǒng)征信數(shù)據(jù),有的則僅僅留下了一些搜索和訪問數(shù)據(jù)。

值得慶幸的是,宜信自成立以來便非常重視數(shù)據(jù)的電子化,因此大大減輕了將線下數(shù)據(jù)進(jìn)行數(shù)字化的工作量。不過,宜信業(yè)務(wù)線眾多,Joyce 告訴我們,將不同業(yè)務(wù)線里沉淀下來的數(shù)據(jù)打通也是一件很費(fèi)勁的事情。

2、搜索引擎抓取

Zest Finance 的 CEO Merill 認(rèn)為,信貸記錄屬于強(qiáng)變量,而當(dāng)強(qiáng)變量缺失的時(shí)候,就可以參考多種弱變量(比如互聯(lián)網(wǎng)上的行為數(shù)據(jù)),將這些弱變量組合起來也可以服務(wù)于信用評(píng)估。

同樣是基于這種思路,宜信自己做了一個(gè)叫做“宜搜”的搜索引擎。在獲得用戶授權(quán)許可的情況下,搜索引擎會(huì)抓取用戶在互聯(lián)網(wǎng)上留下的電商購(gòu)買數(shù)據(jù)、搜 索引擎數(shù)據(jù)、社交數(shù)據(jù)等多個(gè)維度的數(shù)據(jù)。除此之外,還有大量散落在網(wǎng)上的公開數(shù)據(jù),這些數(shù)據(jù)也會(huì)被宜搜所抓取。這兩類數(shù)據(jù)將通過特定的算法模型轉(zhuǎn)化為信用 評(píng)估數(shù)據(jù)。

3、來自合作伙伴的數(shù)據(jù)

這里的合作伙伴既包括線上的也包括線下的,不過 Joyce 并沒有透露現(xiàn)在正在參與合作的公司有哪些。我猜測(cè),線下的合作機(jī)構(gòu)可能包括小貸公司、租車公司、房屋中介等可能產(chǎn)生業(yè)務(wù)協(xié)同的機(jī)構(gòu),線上的合作對(duì)象則有更多可能性了,比如各種互聯(lián)網(wǎng)金融服務(wù)商。

有一個(gè)繞不開的問題,那就是如何保證數(shù)據(jù)的真實(shí)性,其實(shí)這是所有的大數(shù)據(jù)分析都會(huì)遇到的問題。其實(shí),任何人也無法保證數(shù)據(jù)完全真實(shí)、沒有噪音,可以做的就是對(duì)不同的數(shù)據(jù)源進(jìn)行關(guān)聯(lián)和交叉驗(yàn)證。Joyce 說:“我們并不是在盲目的追求線上實(shí)時(shí)授信,如果沒有足夠的數(shù)據(jù)來做交叉驗(yàn)證,我們還是會(huì)采取線上線下相結(jié)合的方式?!?/p>

  • 機(jī)器學(xué)習(xí)是平臺(tái)的核心

采集數(shù)據(jù)的目的是通過相應(yīng)的數(shù)據(jù)分析和挖掘技術(shù)輸出每個(gè)人的信用評(píng)估結(jié)果。在傳統(tǒng)的數(shù)據(jù)處理領(lǐng)域,分析師們處理的主要是結(jié)構(gòu)化數(shù)據(jù),而如今我們面對(duì) 的是從網(wǎng)上抓取的大量非結(jié)構(gòu)化數(shù)據(jù),如社交網(wǎng)絡(luò)的評(píng)論、用戶上傳的音視頻等。這些數(shù)據(jù)存在于包括文本、圖片、視頻、音頻等眾多的數(shù)據(jù)格式中,其中蘊(yùn)藏的信 息需要深度計(jì)算才可以分析出來。這就需要通過機(jī)器學(xué)習(xí)進(jìn)行智能化分析。

根據(jù)過往的業(yè)務(wù)經(jīng)驗(yàn),Joyce 團(tuán)隊(duì)會(huì)給這個(gè)“挖掘機(jī)系統(tǒng)”預(yù)設(shè)一些規(guī)則引擎(可以理解為一些基礎(chǔ)的算法),引導(dǎo)系統(tǒng)做出一些基本的判斷和決策。比如,沒有收入的人會(huì)被直接排除在借款人群之外。

但是,這都是些基礎(chǔ)規(guī)則,而且是基于現(xiàn)有數(shù)據(jù)和經(jīng)驗(yàn)生成的。一旦充入大量新數(shù)據(jù),這些既有規(guī)則引擎則會(huì)發(fā)生變化。無論是修訂現(xiàn)有規(guī)則還是獲得新的規(guī)則,都需要通過機(jī)器學(xué)習(xí)來實(shí)現(xiàn)。

當(dāng)然,機(jī)器學(xué)習(xí)是一個(gè)動(dòng)態(tài)的過程——要通過不斷加大數(shù)據(jù)變量來修正機(jī)器學(xué)習(xí)的模型。只要池子里變量的維度多到一定程度,模型就會(huì)趨于穩(wěn)定。舉個(gè)例 子,如果你買一支股票,你的收入就全都取決于這只股票的漲跌;但如果你分散投資 1000 支股票,從統(tǒng)計(jì)學(xué)角度,即使其中一只股票暴跌,也不會(huì)對(duì)你的整體資產(chǎn)走勢(shì)產(chǎn)生影響。只要數(shù)學(xué)邏輯正確,采用的變量越多,模型就越準(zhǔn)確。而且,數(shù)據(jù)維度的不 斷豐富也能讓機(jī)器在不斷學(xué)習(xí)的過程中變得越來越智能。

宜信的第一批機(jī)器是在今年 4 月上線的,里面正跑著數(shù)以萬計(jì)的變量。未來,收集和整理數(shù)據(jù)的門檻會(huì)降低,而利用機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)分析和挖掘的能力會(huì)成為關(guān)鍵。

數(shù)據(jù)的價(jià)值

人人有信用,信用有價(jià)值。大數(shù)據(jù)能改變的不僅是金融行業(yè)。在一個(gè)真正市場(chǎng)化的社會(huì)中,各行各業(yè)都對(duì)個(gè)人信用評(píng)估有訴求,因此,基于大數(shù)據(jù)的個(gè)人信用 評(píng)估結(jié)果可以成為很多商業(yè)活動(dòng)的基礎(chǔ)。如今,通過將用戶的互聯(lián)網(wǎng)行為數(shù)據(jù)轉(zhuǎn)化為 “互聯(lián)網(wǎng)信用”后,這些數(shù)據(jù)也開始變得有價(jià)值起來。

  • 數(shù)據(jù)定價(jià)

既然數(shù)據(jù)都是有價(jià)值的,那么是否可以給數(shù)據(jù)定價(jià)?“應(yīng)該理解為價(jià)值交換”,Joyce 更正了我的說法,“數(shù)據(jù)的價(jià)值剛剛被喚醒,現(xiàn)在談定價(jià)、收費(fèi)還為時(shí)過早。”

目前,宜信已經(jīng)與一些線下機(jī)構(gòu)和線上互聯(lián)網(wǎng)服務(wù)商建立了數(shù)據(jù)合作關(guān)系,但各家的合作方式都不太一樣。尤其是對(duì)于不同行業(yè)來說,服務(wù)提供商的訴求差異 巨大。Joyce 說:“我們也希望與不同合作伙伴來探討適合彼此的價(jià)值交換方式。經(jīng)過一段時(shí)間的合作,我們會(huì)逐漸建立一套針對(duì)不同數(shù)據(jù)提供商的價(jià)值交換模型和方法論?!?/p>

  • 數(shù)據(jù)變現(xiàn)

Joyce 好幾次都提到了“數(shù)據(jù)變現(xiàn)”的概念?;ヂ?lián)網(wǎng)行業(yè)里有很多這樣的服務(wù)提供商:他們有用戶、有流量、有數(shù)據(jù),但卻找不到自己的商業(yè)模式。又或者,即使有自己的商業(yè)模式,很多服務(wù)提供商手中的數(shù)據(jù)也遠(yuǎn)沒有發(fā)揮什么作用?!皵?shù)據(jù)變現(xiàn)”為他們提供了一個(gè)通過數(shù)據(jù)完成價(jià)值增值的思路。舉兩個(gè)例子:

  • 為商家提供額外的變現(xiàn)渠道。以宜信與 eBay 合作的“商通貸”為例:eBay 可以專注的做自己的電商生意,而如果 eBay 上的用戶或商家有分期或者融資的需求時(shí),eBay 只需開通相應(yīng)的頻道,并把用戶數(shù)據(jù)授權(quán)給宜信進(jìn)行處理,宜信來完成用戶信用的評(píng)估并完成分期產(chǎn)品推薦、貸款實(shí)時(shí)授信等。
  • 幫商家提高用戶轉(zhuǎn)化率。中國(guó)有很多租賃場(chǎng)景都是需要交押金的,而交押金往往會(huì)影響平臺(tái)的轉(zhuǎn)化率。因此,宜信在與各種租賃公司嘗試一種合作: 租賃公司把用戶的信息給宜信,宜信再結(jié)合自己抓取的一部分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行信用評(píng)估,給出一個(gè)“信用價(jià)值”,從而免去用戶的押金,并扮演平臺(tái)的擔(dān)保方,甚至 能提供租后管理服務(wù)。

不是競(jìng)爭(zhēng)對(duì)手,是盟友

國(guó)內(nèi)想通過大數(shù)據(jù)做開放金融云平臺(tái)的不止宜信一家,別忘了最有名的那家——螞蟻金服。在螞蟻金服的成立活動(dòng)上,其 CFO 井賢棟曾說過:“螞蟻金服將以小微企業(yè)和普通消費(fèi)者為主要用戶,建立以數(shù)據(jù)、技術(shù)、交易這三個(gè)開放平臺(tái)為核心的金融生態(tài),支持和幫助合作伙伴,共同為用戶創(chuàng)造價(jià)值?!?/p>

這和宜信的愿景不謀而合,不過,在 Joyce 看來,談彼此間的競(jìng)爭(zhēng)還為時(shí)過早。在國(guó)內(nèi),通過大數(shù)據(jù)搭建信用體系這件事還處于非常早期的探索階段,大家各自有優(yōu)勢(shì),但還沒有誰已經(jīng)走通了這條路。“如果未來有可能,我們非常樂意與螞蟻金服合作?!?/p>

其實(shí),除了宜信、阿里這樣打算做“生態(tài)系統(tǒng)”的平臺(tái),大數(shù)據(jù)金融場(chǎng)內(nèi)的玩家還有不少。比如各種尚未走到生態(tài)系統(tǒng)層面的第三方大數(shù)據(jù)平臺(tái),舉幾個(gè)例子:國(guó)內(nèi)最早提出做大數(shù)據(jù)征信的閃銀(類似 Zest Finance)、從 SaaS 系統(tǒng)切入數(shù)據(jù)服務(wù)領(lǐng)域的中科柏誠(chéng)、為線下 P2P 公司提供大數(shù)據(jù)服務(wù)的數(shù)信網(wǎng)。另外,還有一些在利用大數(shù)據(jù)支撐自身互聯(lián)網(wǎng)金融業(yè)務(wù)的公司,比如拍拍貸(類似 Lending Club)、元寶鋪(類似 Kabbage)。

但是,所有機(jī)構(gòu)手中的數(shù)據(jù)都是片面的數(shù)據(jù),尤其是對(duì)于 BAT 這樣的巨頭來說。這也是為什么,在 Joyce 看來,平臺(tái)間的合作遠(yuǎn)比盲目的競(jìng)爭(zhēng)更有利于行業(yè)的成長(zhǎng)?!斑@個(gè)市場(chǎng)非常大,完全可以容納多個(gè)開放平臺(tái)同時(shí)存在。如果有更多的人愿意踏踏實(shí)實(shí)的做金融開放平 臺(tái),這對(duì)行業(yè)、乃至整個(gè)小微人群是非常有益的。”

即使是在未來的金融生態(tài)中,合作也應(yīng)該大于競(jìng)爭(zhēng)?!吧鷳B(tài)系統(tǒng)” 本身便是一種商業(yè)模式。金融業(yè)的生態(tài)系統(tǒng)長(zhǎng)什么樣?它將以云計(jì)算、大數(shù)據(jù)為底層,信用體系為基礎(chǔ),支撐包括支付、投融資、理財(cái)、保險(xiǎn)、銀行等在內(nèi)的多種業(yè)務(wù)。

“在美國(guó),信用是一張個(gè)人通行證。而對(duì)于中國(guó)來說,這是我們走向一個(gè)真正市場(chǎng)化的商業(yè)社會(huì)的過程中必然會(huì)達(dá)到的階段。未來,我們會(huì)有多個(gè)信用評(píng)估機(jī)構(gòu),每個(gè)機(jī)構(gòu)都有自己的一套信用評(píng)估體系,而大家對(duì)信用的認(rèn)識(shí)能夠嵌入到各行各業(yè)的商業(yè)活動(dòng)中?!?/p>

這大概就是在國(guó)外大數(shù)據(jù)領(lǐng)域鉆研了 15 年后卻帶著團(tuán)隊(duì)義無反顧回到國(guó)內(nèi)的 Joyce 想看到的一天吧。

 

原文來自:36KR

作者:張雨忻

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 去年看到這篇文章的的時(shí)候,也和第一位留言者一樣認(rèn)為這是水文,但今天,在網(wǎng)貸之家的排名,看到宜人貸排名超過陸金所??赡芎髞淼娜丝吹竭@條消息,會(huì)覺得不以為然,但是陸金所真的排了很久的第一了?!斑@大概就是在國(guó)外大數(shù)據(jù)領(lǐng)域鉆研了 15 年后卻帶著團(tuán)隊(duì)義無反顧回到國(guó)內(nèi)的 Joyce 想看到的一天吧?!庇行r(shí)候真的要堅(jiān)定不移的相信自己可以創(chuàng)造未來。

    來自浙江 回復(fù)
  2. 水文

    來自上海 回復(fù)