國內(nèi)金融領域一直面臨著很多挑戰(zhàn),欺詐風險是其中最為凸出的。隨著人工智能技術的發(fā)展,發(fā)欺詐手段有望獲得重大升級,進一步提高金融領域安全系數(shù)。
欺詐風險是國內(nèi)金融領域面臨的最大挑戰(zhàn)之一,大部分金融機構長期受欺詐影響。全球領先的風險管理咨詢公司Kroll發(fā)布的《2016/17年度全球反欺詐及風險報告》指出,欺詐造成的受欺詐損失占營業(yè)額0.5%至3%之間不等(已核實的部分),并且隨著欺詐手段日趨多元化,這一占比在逐年上升。因此,反欺詐已被金融機構和監(jiān)管部門視為重要議題。
高維度機器學習模型:反欺詐方案的“內(nèi)核”
以往,銀行在偵測信用卡線下欺詐交易方面通常會采用專家規(guī)則的方式,即行內(nèi)人員通過對欺詐案例的欺詐主體、手段等進行分析和總結,形成專家規(guī)則。這種規(guī)則的有效性是毋庸置疑的,但是同時也存在一些不足:首先,專家規(guī)則是由人來制定的,但人的思維往往是采用“抓大放小”的方式,因而其難以覆蓋長尾的交易欺詐場景;其次,欺詐手段日趨多元化,但人很難快速準確地掌握新型欺詐手段的特征與規(guī)則,以應對欺詐行為的持續(xù)變化。諸多因素導致專家規(guī)則目前在罕見的、新的欺詐案件上有所局限。而通過機器學習技術,可以大幅提升這些欺詐案件的偵測率。
第四范式基于”機器學習“的反欺詐解決方案,是通過從交易報文、用戶、卡片等信息、訓練出一個高維度模型,從而找出一些很難被專家規(guī)則發(fā)現(xiàn)的特征,這恰恰是機器所擅長的。
在數(shù)據(jù)預處理環(huán)節(jié),第四范式的反欺詐解決方案采用了全量樣本進行數(shù)據(jù)建模。在特征工程階段,機器學習和專家規(guī)則一樣,首先需要抽取交易報文、用戶信息、卡人卡片檔等基本信息,之后再結合其他已有數(shù)據(jù),在符合業(yè)務邏輯的情況下,通過將交易報文中的原始字段進行超高維組合、衍生。最終,對比于總數(shù)在千條之內(nèi)的專家規(guī)則,第四范式設計的大數(shù)據(jù)機器學習模型的反欺詐特征體系,在總量超過25億維的特征集上進行探索,最終發(fā)現(xiàn)有效特征8000萬維,如此高維的規(guī)則是很難被不法分子攻破的。
此外,機器學習對于出現(xiàn)概率低的“非典型特征”以及不斷更新中的特征,都有著超強的識別、總結能力。交易欺詐從數(shù)據(jù)上看實際上是一些模式(pattern)的變化,如果是非典型的欺詐手段,較難被專家規(guī)則命中,但機器學習的模型可能捕捉到這些異常模式(pattern)。具體來說,某次交易會同時命中多條弱模式(pattern),從而識別出該筆為欺詐交易。除此之外,即使欺詐手段發(fā)生徹底的變化,機器學習可以從案例中不斷自主更新學習,以適應新的欺詐手段。
第三代實時反欺詐架構:反欺詐方案的“載體”
擁有出色的模型之后,如何將它應用在反欺詐體系中成為了另一道難題。模型越出色,則意味著對系統(tǒng)架構的要求約苛刻。
首先,在延遲方面,每筆信用卡交易的時長基本上在一百毫秒以內(nèi),換句話來說,實現(xiàn)對欺詐交易的阻攔全過程要控制在毫秒級,因此留給模型判斷的時間非常短暫。如果處理過慢計算結果就會被丟棄,間接影響反欺詐效果。其次是穩(wěn)定性。穩(wěn)定性是指兩個方面,其一是系統(tǒng)的高可用性,反欺詐系統(tǒng)必須保證較高的服務可用率。其二是系統(tǒng)的響應穩(wěn)定性,比如在所有交易請求中,99%的交易響應時間需要控制在一定的范圍內(nèi)(P99)。最后是如何支持機器學習對高位特征計算以及預估的需求。
此前,銀行共出現(xiàn)了兩代實時反欺詐架構。第一代的實時反欺詐架構雖實現(xiàn)了對當前交易進行欺詐識別需求,但是無法滿足專家規(guī)則對交易歷史數(shù)據(jù)需求,且流式計算引擎運行較為復雜,難以保證在限定的時間內(nèi)完成所有規(guī)則的計算。
突破技術壁壘人工智能為銀行反欺詐提供新思路
相比于第一代,第二代的實時反欺詐架構引入對歷史交易數(shù)據(jù)的支持,也支持了較為簡單的機器學習算法,但支持的特征維度小于1萬,無法充分發(fā)揮機器學習的能力,且系統(tǒng)響應的穩(wěn)定性仍需提升。
突破技術壁壘人工智能為銀行反欺詐提供新思路
針對前兩代反欺詐框架的弊端,第四范式的工程開發(fā)人員從架構層面做了更加深入的優(yōu)化,提出了第三代反欺詐技術架構,其優(yōu)勢有以下三點:
1.第四范式的實時反欺詐架構是一套真正面向機器學習場景的架構,目前已支持千萬級別的高維特征。
2.第四范式的實時反欺詐架構有效結合了對長、短歷史交易日志和交易行為的學習和應用。例如選擇當前交易近一個月內(nèi)的交易行為記錄做實時的聚合與特征抽取;選擇當前交易近四個月或者更長時間的交易記錄做線下預聚合與特征抽取,并對預估模塊做定期更新及優(yōu)化。
3.第四范式的實時反欺詐架構在保證系統(tǒng)穩(wěn)定性的同時,保證P99控制在限定的時間內(nèi),實現(xiàn)了系統(tǒng)的高性能和高可用。
突破技術壁壘人工智能為銀行反欺詐提供新思路
此外,該反欺詐模型在保證行業(yè)通用性的同時,還能通過自身研發(fā)達到最佳的模型效果,且每個模塊都具備通用性,均可以根據(jù)不同的業(yè)務實現(xiàn)單獨的定向配置。未來,該模型還可應用于更多實時、性能要求高的業(yè)務,更好地發(fā)揮其優(yōu)勢。
機器學習為銀行反欺詐帶來新契機
第四范式的機器學習模型在不同覆蓋率的情況下,準確率比照專家規(guī)則和傳統(tǒng)模型都有了極大提升。在對高危欺詐交易的偵測上,機器學習的模型效果顯著,甚至能將現(xiàn)有的對可疑交易的“事后反欺詐”(主要通過電話確認)轉(zhuǎn)化為“事中反欺詐”(在交易進行過程中,直接終止交易,需要非常高的準確率),節(jié)省了銀行的人力成本和運營投入。而在覆蓋絕大多數(shù)交易欺詐交易的情況下,與專家規(guī)則結合的機器學習模型能夠為銀行帶來數(shù)目可觀的額外的防堵金額收益。
與業(yè)界領先、訓練數(shù)據(jù)龐大的國際卡組織提供的反欺詐解決方案相比,第四范式的反欺詐模型僅依靠某銀行的交易數(shù)據(jù),便做到了更加出色的效果。
通過評估,機器學習技術與傳統(tǒng)專家規(guī)則結合,反欺詐的效果將更為出色。未來在實際應用中,隨著機器學習模型與專家規(guī)則的深入結合,行內(nèi)人員將會逐漸減少更新傳統(tǒng)專家規(guī)則的時間,將更多的精力放在優(yōu)化機器學習模型上,使反欺詐系統(tǒng)達到最優(yōu)效果。
由第四范式自主研發(fā)的反欺詐解決方案,通過人工智能技術為欺詐風險進行精準的預測和評估,協(xié)助金融機構及時發(fā)現(xiàn)、規(guī)避潛在欺詐風險,將引領金融領域反欺詐業(yè)務的智能化趨勢。第四范式具備眾多經(jīng)驗豐富的一線互聯(lián)網(wǎng)公司前、后端開發(fā)人員,以及出色的科學家團隊,將尖端的人工智能技術轉(zhuǎn)換成可落地的人工智能產(chǎn)品及解決方案。此外,團隊成員還包括來自投行、咨詢公司、金融機構的行業(yè)專家和資深顧問,把對行業(yè)的深厚理解和對人工智能技術的嫻熟運用相結合。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。