金融不是說(shuō)量做的大,最后就一定能跑贏,但互聯(lián)網(wǎng)不是,互聯(lián)網(wǎng)是玩杠桿的,錢是投資人的錢或者說(shuō)是資金方的錢,把錢燒了,把用戶數(shù)做上來(lái)就可以。美國(guó)不敢這么玩,為什么?他們真正經(jīng)歷過(guò)金融危機(jī)。
我從美國(guó)回到中國(guó),最大一個(gè)感受是,中國(guó)的互聯(lián)網(wǎng)真是比美國(guó)激進(jìn)太多,燒錢跑規(guī)模成了行業(yè)慣例,不管收入不管盈利,燒錢把用戶量做上去就算贏了。就是互聯(lián)網(wǎng)金融這個(gè)行業(yè),也經(jīng)常能看到在用戶量和交易量上驚人的現(xiàn)象。
但是我雖然在一個(gè)互聯(lián)網(wǎng)金融公司,但我的看法可能不那么“互聯(lián)網(wǎng)”。在我看來(lái),金融的邏輯和互聯(lián)網(wǎng)不一樣。
第一,是行業(yè)邏輯不一樣。
金融并不是贏家通吃的行業(yè)?;ヂ?lián)網(wǎng)都是寡頭統(tǒng)治,阿里統(tǒng)治電商,騰訊統(tǒng)治社交。但是金融不是這個(gè)邏輯。金融是一個(gè)經(jīng)營(yíng)風(fēng)險(xiǎn)的業(yè)務(wù),當(dāng)所有的規(guī)模都集中在一起時(shí),風(fēng)險(xiǎn)也就集中在了一起。
且不說(shuō)你自己能不能玩的下去,政府就不會(huì)袖手旁觀。大而不倒,早晚政府會(huì)接手,這在美國(guó)都有先例,他們可是見(jiàn)識(shí)過(guò)真正金融危機(jī)的,何況中國(guó)。
現(xiàn)代金融歷史幾百年,也沒(méi)有哪個(gè)國(guó)家出現(xiàn)金融的絕對(duì)集中。有人說(shuō)中國(guó)以前有這種現(xiàn)象,改革開(kāi)放前只有一個(gè)中國(guó)人民銀行包攬一切,但那是國(guó)家的業(yè)務(wù),跟市場(chǎng)沒(méi)關(guān)系。
我們?nèi)サ疥懠易烊タ匆幌?,招商銀行旁邊是匯豐,匯豐旁邊是渣打,渣打旁邊是花旗,不存在一個(gè)寡頭統(tǒng)治。金融是十幾萬(wàn)億甚至上百萬(wàn)億級(jí)的市場(chǎng),所以永遠(yuǎn)不要去追逐在這個(gè)市場(chǎng)里邊占50%以上的份額,我認(rèn)為不可能的,這個(gè)市場(chǎng)大到足夠容得下眾多玩家。
第二,是業(yè)務(wù)邏輯不一樣。
金融它是很強(qiáng)調(diào)邊際效應(yīng)的業(yè)務(wù),金融的“邊際化”對(duì)應(yīng)就是“規(guī)?;?rdquo;,然而規(guī)模化往往就是用來(lái)形容互聯(lián)網(wǎng)這個(gè)行業(yè)。從這也能看出互聯(lián)網(wǎng)金融還是偏重金融一些,不靠做量。
因?yàn)榻鹑诓皇钦f(shuō)量做的大,最后就一定能跑贏,金融本來(lái)就不是做量的,更別說(shuō)為了做量而放寬風(fēng)險(xiǎn)的控制。
拿我們信貸行業(yè)來(lái)說(shuō),控制逾期的方式其實(shí)就兩種,一個(gè)是做分子,一個(gè)是做分母。所謂的做分子就是把你真正壞賬的部分壓下去。
而做分母就是說(shuō)壞賬不斷的增長(zhǎng)同時(shí),加大貸款的數(shù)量,體量大了讓優(yōu)質(zhì)貸款為劣質(zhì)貸款買單,短期也是可以把壞賬率往下降的。
但我們更愿意選擇前者,因?yàn)橐坏┎捎米龇帜改J降脑?,就進(jìn)入了一個(gè)被動(dòng)的周期,被動(dòng)的追求數(shù)量就會(huì)被動(dòng)放棄質(zhì)量。
為了做大分母讓更多人獲得貸款,就要被動(dòng)的放寬風(fēng)控審核條件,邊際被動(dòng)放寬,風(fēng)險(xiǎn)也會(huì)越來(lái)越控不住的。
所以我們更愿意做的是,在可控的范圍之內(nèi),獲取最大用戶量。
中國(guó)的征信體系才剛剛建立,有效的信用數(shù)據(jù)還不全面,不像美國(guó)以及擁有了很成熟的信用體系和征信體系。
在這種情況下,面對(duì)有信貸需求的用戶,我們不會(huì)像傳統(tǒng)金融機(jī)構(gòu)一樣,只做簡(jiǎn)單的風(fēng)險(xiǎn)控制,把大量的潛在用戶拒之門外,而是通過(guò)我們的算法對(duì)計(jì)算出用戶的風(fēng)險(xiǎn)偏好,提供動(dòng)態(tài)的授信決策。
風(fēng)險(xiǎn)偏好決定了風(fēng)險(xiǎn)的可控范圍,只要風(fēng)險(xiǎn)在可控的范圍之內(nèi),我們就可以最大化的獲取用戶,產(chǎn)生最大化的價(jià)值。即使對(duì)待一個(gè)風(fēng)險(xiǎn)偏高的用戶,我們也會(huì)有自己的界定,不會(huì)一刀切似的拒絕。
比如我們會(huì)用風(fēng)險(xiǎn)定價(jià)的方式給他一個(gè)比較高的貸款利率或者是比較低的借貸額度。如果他的幾次信貸記錄都非常良好,那在之后的運(yùn)營(yíng)過(guò)程中,我們會(huì)動(dòng)態(tài)調(diào)整他的授信額度或者貸款利息,從而增加用戶粘性。反過(guò)來(lái),如果用戶在還款過(guò)程中表現(xiàn)出了風(fēng)險(xiǎn)比較高,經(jīng)常不還款,我們也會(huì)凍結(jié)他的額度。
中國(guó)的數(shù)據(jù)太分散了,沒(méi)有像美國(guó)三大征信局這樣的信用庫(kù),于是我們引入跟金融不是強(qiáng)相關(guān)的弱變量。
我回來(lái)中國(guó)工作第二個(gè)感受是,我們國(guó)家消費(fèi)金融行業(yè)從來(lái)不缺少思維活躍的人,這是好事也是壞事,思維越活躍,騙局就越多,對(duì)我們做數(shù)據(jù)的人來(lái)說(shuō),每一天都有新挑戰(zhàn)。
中國(guó)的央行征信體系雖然已經(jīng)覆蓋近8億人,但基本上只對(duì)金融機(jī)構(gòu)開(kāi)放,比如銀行、小金公司和小貸公司。雖然極大程度的保護(hù)了用戶信息,但是對(duì)于我們做數(shù)據(jù)決策,沒(méi)有數(shù)據(jù)支撐還是太難了。在美國(guó)的話,拿我以前在Capital One的經(jīng)驗(yàn)舉例。Capital One做的是主流消費(fèi)信貸,主要接入的是三大信用局?jǐn)?shù)據(jù)來(lái)做零售信貸業(yè)務(wù)。三大信用局對(duì)美國(guó)的主流人群基本上就可以覆蓋了。
在中國(guó)也有一些機(jī)構(gòu)自稱是在提供一個(gè)行業(yè)的解決方案。聲稱是搜集到了各個(gè)行業(yè)主動(dòng)給予的黑名單,然后這個(gè)機(jī)構(gòu)進(jìn)行整合并且建立一個(gè)“聯(lián)防聯(lián)控”的解決方案,有點(diǎn)兒像美國(guó)征信據(jù)局干的事。
比如以前我們?cè)贑apital One給一個(gè)用戶發(fā)了信用卡,但是他屢次逾期最終賬戶被注銷,那我們就會(huì)把這個(gè)的信用情況交給美國(guó)征信局,那他在其他機(jī)構(gòu)再申請(qǐng)貸款的時(shí)候,機(jī)構(gòu)就可以從征信局查到他的這些不良記錄,可能就會(huì)不再房貸給他。
但是在中國(guó),這些信息的整合還不是政府行為,很多時(shí)候很多一些比較小的機(jī)構(gòu),沒(méi)有監(jiān)管,就很有可能讓沒(méi)有職業(yè)操守的機(jī)構(gòu)鉆了空子。比如這些小機(jī)構(gòu)會(huì)自行上傳一些黑名單上去批的也沒(méi)辦法驗(yàn)真。
如果這些在假的黑名單中的用戶在別家想要申請(qǐng)貸款自然申請(qǐng)不到,就只能去找這個(gè)這個(gè)黑機(jī)構(gòu)了。
沒(méi)有征信局,沒(méi)有靠譜的民間聯(lián)盟怎么辦?這也是中國(guó)一個(gè)非常大的特點(diǎn),除了傳統(tǒng)的征信數(shù)據(jù)以外,我們運(yùn)用一些所謂的弱變量,弱變量就是說(shuō)它不是跟你收入多少、或者你的銀行信用卡額度多少這些金融數(shù)據(jù)強(qiáng)相關(guān)的。而是非常散的一些數(shù)據(jù),包括征信數(shù)據(jù),消費(fèi)記錄、通信數(shù)據(jù)或者社交數(shù)據(jù)等等。
在中國(guó)在用戶授權(quán)的前提下,我們會(huì)接入銀聯(lián)的消費(fèi),通信數(shù)據(jù),社交數(shù)據(jù)以及電商的消費(fèi)記錄數(shù)據(jù)等等。比如說(shuō)和場(chǎng)景類的平臺(tái)合作,比如像攜程、去哪兒,他們會(huì)有一些用戶在他們平臺(tái)上消費(fèi)的記錄,這些消費(fèi)記錄其實(shí)是對(duì)做風(fēng)險(xiǎn)是非常有用的
它可以解讀出很多信息,比如從時(shí)間和交易次數(shù)這緯度來(lái)判斷這是不是個(gè)忠實(shí)客戶;其次,是這個(gè)客戶的消費(fèi)能力,比如是不是經(jīng)常出行,是商業(yè)出行還是個(gè)人出行呢?出行時(shí)候坐的是經(jīng)濟(jì)艙還是商務(wù)倉(cāng)呢?這些數(shù)據(jù)間的關(guān)聯(lián)就可以判斷出一個(gè)人的收入情況和消費(fèi)能力。
跟螞蟻金服的芝麻信用合作,實(shí)際上是獲取了支付寶的數(shù)據(jù)。這對(duì)B端小企業(yè)主,它可以看到電商的流水和負(fù)債;對(duì)C端消費(fèi)者,可以判斷C端用戶的消費(fèi)行為能力。這種數(shù)據(jù)在美國(guó)就不太可能會(huì)有,除非Amazon自己做,但它好像也沒(méi)在做。
社交數(shù)據(jù),對(duì)這個(gè)領(lǐng)域獲取的數(shù)據(jù)就目前來(lái)看還是以有趣的探索為主,現(xiàn)在社交網(wǎng)絡(luò)都是實(shí)名登記,從手機(jī)號(hào)就可以看到用戶是不是微博用戶或者是不是知乎用戶,他們有多少粉絲,原創(chuàng)與轉(zhuǎn)發(fā)有多少號(hào)召力。
像美國(guó)有很多基于Twitter來(lái)做數(shù)據(jù)的,甚至有人是通過(guò)關(guān)注Twitter內(nèi)容炒股的,但社交數(shù)據(jù)目前至少在中國(guó),這些也還只是一個(gè)有趣的方向,有效數(shù)據(jù)比重很少,效果不明顯,花大力氣研究事倍功半,前文也說(shuō)了,金融還是一個(gè)講賺錢的業(yè)務(wù),燒錢燒腦只能選一個(gè)。
在大數(shù)據(jù)的時(shí)代下,尤其中國(guó)的信用體系才剛剛建立,數(shù)據(jù)一定是比較稀疏分散的,我們有上千緯度的數(shù)據(jù)和上萬(wàn)個(gè)緯度可以用戶的評(píng)定,對(duì)每一個(gè)真實(shí)用戶做有效信息判定,就好像受孕一樣難。
每一個(gè)用戶帶著上萬(wàn)條的信用數(shù)據(jù)進(jìn)來(lái),有效數(shù)據(jù)并且受用的可能就是受孕的那極少部分,大部分還是缺失的,或者查不到。想想懷孕多難就知道了,所以在數(shù)據(jù)總量大,有效多的情況下,我們要對(duì)這種比較稀疏的數(shù)據(jù)有一個(gè)處理能力。
實(shí)際上我們整天的工作就是在跟各種各樣的數(shù)據(jù)打交道,但這個(gè)過(guò)程中要像一個(gè)狐貍一樣有著敏銳的感官,很多時(shí)候去建立一些新鮮的事情,新鮮的緯度,可能我們選出來(lái)的維度有90%或者80%都是最后沒(méi)有太大的決定性的作用。
但是我們其實(shí)都會(huì)花很多時(shí)間把特征放到模型里面評(píng)估,最終就是看它跟風(fēng)險(xiǎn)有沒(méi)有關(guān)聯(lián)度,或者跟我們所要的這個(gè)指標(biāo)有沒(méi)有關(guān)聯(lián)度,如果一旦有關(guān)聯(lián)度,我們就認(rèn)為它是個(gè)很好的變量,如果沒(méi)有關(guān)聯(lián)度的話,那就重頭再來(lái),這個(gè)過(guò)程很好聽(tīng),叫迭代。
我們的用戶的90%以上都來(lái)自于移動(dòng)端,這在美國(guó)是不敢想象的,防止移動(dòng)端騙貸是新的挑戰(zhàn)。
我們的用戶的90%以上都來(lái)自于移動(dòng)端,這在美國(guó)是不敢想象的。因?yàn)樗麄兩暾?qǐng)貸款的方式基本上還是通過(guò)PC機(jī),甚至是填寫(xiě)紙質(zhì)的申請(qǐng)資料。從這個(gè)角度來(lái)說(shuō),在中國(guó),在用戶授權(quán)的前提下,我們可以抓取更多用戶的行為信息。
比如說(shuō)你的手機(jī)開(kāi)著定位系統(tǒng),就可以獲取你的位置信息,最主要還是能獲取你的手機(jī)的獨(dú)特“指紋”。這個(gè)“指紋”不是iPhone解鎖的那個(gè)指紋,而是指手機(jī)獨(dú)一無(wú)二的特征,比如說(shuō)它的設(shè)備唯一識(shí)別號(hào)、MAC地址、IP地址等等,用來(lái)判斷信貸請(qǐng)求是不是通過(guò)代理,也就是VPN申請(qǐng)的,他有沒(méi)有偽裝過(guò)他的IP地址等等。
抓取行為信息有什么作用呢?通過(guò)抓取用戶手機(jī)的“指紋”信息可以判斷用戶是不是換過(guò)手機(jī)了,當(dāng)然用戶換手機(jī)不一定代表是個(gè)壞事,有可能是手機(jī)壞了丟了或者型號(hào)更新?lián)Q了一個(gè)新的。
但是會(huì)把“指紋”變更作為我們風(fēng)險(xiǎn)識(shí)別的一個(gè)指標(biāo),進(jìn)入到風(fēng)險(xiǎn)測(cè)評(píng)的模型。如果頻繁的換手機(jī)我們會(huì)認(rèn)為是個(gè)太正常的情況。還有一種風(fēng)險(xiǎn)測(cè)評(píng)的模型,我們會(huì)判斷同一個(gè)手機(jī)是不是申請(qǐng)了多次貸款,像個(gè)中介一樣,實(shí)為在替別人在貸款。
比如說(shuō)一臺(tái)手機(jī),這個(gè)手機(jī)他一下申請(qǐng)了100筆貸款,不同的人,不同的姓名身份證號(hào)。這就屬于騙貸了。
中國(guó)現(xiàn)在有很多這種黑色產(chǎn)業(yè)鏈,他們每天工作就是騙貸。一個(gè)人同時(shí)兼顧幾百臺(tái)手機(jī)在不同的平臺(tái)上貸款。
我們發(fā)現(xiàn)設(shè)備“指紋”對(duì)付欺詐是非常有用的。同一個(gè)設(shè)備同一天是否申請(qǐng)了多筆借款;或者同一臺(tái)設(shè)備為不同的人申請(qǐng)借款,這些都是以往審批通過(guò)在PC申請(qǐng)和紙質(zhì)的申請(qǐng)表申請(qǐng)貸款所遇不到的問(wèn)題。
對(duì)申請(qǐng)者手機(jī)地理位置異樣的抓取,比如說(shuō)你一下子在北京,一下子又到了紐約,這就很有可能判斷你開(kāi)了VPN。通過(guò)我們算法就可以對(duì)一些高危的行為進(jìn)行管控,也會(huì)對(duì)用戶進(jìn)行預(yù)警與告警,從反欺詐的角度來(lái)說(shuō)是一個(gè)非常好的防范。
既然AI先生來(lái)了,就讓咱們家那些個(gè)騾子啊馬啊,那些個(gè)大牲口都歇了吧。
我從美國(guó)回來(lái),還有第三個(gè)感受就是,中國(guó)市場(chǎng)太喜歡“蹭熱度”了。
一個(gè)阿法狗的亮相,AI神話了,仿佛可以把所有積攢的數(shù)據(jù)往里一扔,然后就能幻化出一個(gè)神奇的結(jié)果,而且這個(gè)結(jié)果都是美好的,也是我們正想要的。其實(shí)做過(guò)數(shù)據(jù)的人就知道,輸出質(zhì)量是由輸入質(zhì)量決定的,并沒(méi)有一個(gè)超強(qiáng)大腦,把所有東西放進(jìn)去,出來(lái)就是好東西。
Garbage in,garbage out,是計(jì)算機(jī)科學(xué)和數(shù)學(xué)中很常見(jiàn)的概念,輸出質(zhì)量是由輸入質(zhì)量決定的。舉例來(lái)說(shuō),如果一個(gè)數(shù)學(xué)方程表達(dá)不當(dāng),答案就不太可能正確。同樣地,如果不正確的數(shù)據(jù)輸入到一個(gè)程序,輸出的就可能是無(wú)用信息。
就像阿法狗一樣,阿法狗大家只看到了它跟李世石打仗的那一面,阿法狗下棋本身其實(shí)是Google Real-Time上百工程師在隨時(shí)調(diào)整阿法狗的算法,所以阿法狗并不是一個(gè)電腦坐在你對(duì)面,是算法還有調(diào)整算法的工程師。
在中國(guó),信用體系才剛剛建立,央行的征信體系雖然覆蓋了近8億,但是面對(duì)14億人民,從百分比來(lái)看就是還有近40%沒(méi)有覆蓋。而且數(shù)據(jù)來(lái)源分散,每一個(gè)來(lái)源的數(shù)據(jù)又單一。
這些很分散、有獨(dú)特的中國(guó)市場(chǎng)特征的數(shù)據(jù),我們需要通過(guò)一個(gè)有邏輯的方式接入進(jìn)去。就像Real-Time,F(xiàn)ast data秒級(jí)對(duì)所有的數(shù)據(jù)進(jìn)行響應(yīng),這是科技?;氐綄?duì)數(shù)據(jù)的運(yùn)用這個(gè)問(wèn)題上,我們需要去強(qiáng)調(diào)一種關(guān)注問(wèn)題本身,解決問(wèn)題,而不是打造酷炫的大腦外殼。真正去靜下心做數(shù)據(jù)特征挖掘,整理數(shù)據(jù),然后做一個(gè)比較好的模型,比什么都強(qiáng)。
但有時(shí)候,不是說(shuō)科技打敗了很多人類的東西,而是自動(dòng)化打敗了很多人類的東西,自動(dòng)化不是做了一個(gè)人類做不了的東西,而是他把人類能做的事情用非常非??斓姆椒ㄗ隽?。
比如我們現(xiàn)在做的智能信貸系統(tǒng),可以做到十秒鐘授信,沒(méi)有任何人工的干預(yù),全部實(shí)現(xiàn)自動(dòng)化,我們可以接很多單,幾百萬(wàn)、幾千萬(wàn)單都沒(méi)問(wèn)題。
這是在傳統(tǒng)的銀行是不可想象的,因?yàn)殂y行是有人工成本的。審批員他就是成本,而且他得正常休息,雙休日不上班的,節(jié)假日也不上班。
就像春節(jié)就是個(gè)很好的例子,其實(shí)春節(jié)之前人們對(duì)現(xiàn)金或者說(shuō)資金的需求是很大的,但是恰巧那個(gè)時(shí)候銀行很多人,尤其工作和老家不在一個(gè)地方的都會(huì)提前休假了。這個(gè)時(shí)候就會(huì)呈現(xiàn)出一種需求與資源不對(duì)等的現(xiàn)象:我急著用錢,你卻休息了。
而我們所做的就是通過(guò)大數(shù)據(jù)和科學(xué)決策的方法將這個(gè)過(guò)程自動(dòng)化了,自動(dòng)化直接的效果就是將邊際成本是慢慢降下來(lái)了。就像我們的一些分期產(chǎn)品,即使是幾十塊一單的商品我們都可以不考慮人工成本的去進(jìn)行審批。
就算突然有一天我們的接單量一下子增加三倍,那也只需要去擴(kuò)容我的機(jī)器或者說(shuō)滿足系統(tǒng)能支持這么大的一個(gè)峰值就可以了,不需要增加三倍的人。
我舉這個(gè)例子,不是要黑高科技,我一直都對(duì)“科技改變世界”飽有敬畏心的,前沿的科技會(huì)打開(kāi)我們很多思路與壁壘,但與其強(qiáng)行“熱度”,不如在自己從事的行業(yè)或者工作內(nèi)容上精耕深挖。
比如以前我們?cè)贑apital One工作的時(shí)候,數(shù)據(jù)在已有的系統(tǒng)里已經(jīng)被挖掘很深了,卻依然在做精細(xì)化挖掘。我們?cè)谟眯庞镁值臄?shù)據(jù)的同時(shí)也跟FICO(美國(guó)有一個(gè)評(píng)分機(jī)構(gòu))合作,它的分?jǐn)?shù)我們也進(jìn)行比較,我們可能就是比FICO做了一個(gè)小小的算法優(yōu)化,可能只提高5%,但也是在已有的數(shù)據(jù)基礎(chǔ)上挖的很深了。
而現(xiàn)在中國(guó)市場(chǎng)還沒(méi)做到挖的很深,就玩起了花板子。中國(guó)是市場(chǎng)驅(qū)動(dòng),中國(guó)現(xiàn)在市場(chǎng)非常大,跟美國(guó)相比,美國(guó)是商業(yè)驅(qū)動(dòng),他們可能會(huì)覺(jué)得有些數(shù)據(jù),比如社交數(shù)據(jù),有意思,但不會(huì)真的用,為什么,因?yàn)樯虡I(yè)需求不強(qiáng)。
美國(guó)的數(shù)據(jù)很多都是在征信體系內(nèi)已經(jīng)覆蓋了,而且它信用卡的覆蓋人群已經(jīng)到了70%,基本上大部分人擁有完善的信用歷史,你用一些社交數(shù)據(jù)玩一些花,沒(méi)什么決定性的意義。不會(huì)因?yàn)槟阍赥witter上有很多贊就給你很多貸款。
我們正在經(jīng)歷一個(gè)新體系的建立過(guò)程,那一定是一個(gè)井噴的階段,這是我們的優(yōu)勢(shì)。我們現(xiàn)在有很多數(shù)據(jù),以前沒(méi)有用過(guò)的數(shù)據(jù),量大的驚人,比如像電商、社交的場(chǎng)景數(shù)據(jù),銀聯(lián)的消費(fèi)、電話的通信記錄,以及移動(dòng)終端的“指紋”數(shù)據(jù)。
但是有效數(shù)據(jù)挖掘、精細(xì)的處理肯定是弱項(xiàng),但會(huì)是未來(lái)的方向。未來(lái),在中國(guó)肯定會(huì)做的越來(lái)越精細(xì),就是把我們有效數(shù)據(jù)挖掘做的更深,就像我們現(xiàn)在做的事情一樣。
科技改變金融,數(shù)據(jù)開(kāi)拓眼界,這點(diǎn)我從沒(méi)懷疑過(guò)。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。