Categories
程式開發

攻與防之戰,AI風控如何“智”斗金融黑產


成為金融行業的核心競爭力。

AI風控是金融數字化最有價值的應用場景

AI風控目前是金融數字化最主要的應用場景。根據艾瑞諮詢《2020年中國AI+金融行業發展研究報告》,AI風控約占到了2019年AI金融市場規模的45%。AI技術與風控的結合也被銀行等金融機構視為最有價值的技術落地場景。

隨著業務的數字化、線上化進程不斷加快,基於傳統的業務拓展模式所發展起來的傳統風控方式和管控手段已不能適應業務創新的需要,金融機構業務在線上化的過程中可能會面臨虛假申請、偽冒交易、內容違規等風險,面對這些新業務存在的風險,傳統金融機構之前所積累的經驗是否仍舊有效使存在挑戰的。因此,金融業需要與時俱進引進新的技術,以彌補風控體系中的不足。

風險管控是金融企業的核心能力,最近幾年,銀行業對風控技術的投入不斷增加,有不少金融機構選擇和第三方智能風控公司合作構建智能風控體系和平台。

其實現在AI 技術在金融行業風控上面的運用已遠遠走在了合規管理運用的前面,主要在銀行業和互聯網金融業的信貸、反洗錢等場景。機器學習、深度學習、自然語言處理、計算機視覺、知識圖譜、語音識別等AI技術在風控領域都有廣泛應用。

領域內部已形成了一套成熟有效的評估標準來評估風控效果,例如對建模的效果主要的評估指標是召回率和準確率。召回率用來識別和評估有多少未發現的黑產賬戶。準確率評估風控系統判斷的準確度,有沒有誤傷普通用戶。這兩個指標相互對立、相互制衡,當需要更多召回時,可設置更多門檻,用更多特徵將模型的預測調到更低,採用更嚴格的策略,這時召回率提升,但可能對用戶傷害較大。反之,如果想盡可能方便正常用戶,就要改變召回率。

值得注意的是,AI風控的整體目標並不是說要把每一筆欺詐交易、每一個“壞人”全部找出來,這很難也並不現實。風控的最終目標是,即便在任何最惡劣的情況下,仍然能夠對全局的風險做到有效控制。

面臨多重技術挑戰

現階段,AI風控技術在發展和業務應用的過程中一直以來都存在著挑戰,主要體現在以下幾個方面:

  • 信息壁壘

在傳統企業中,特別是在一些大型的企業中,系統之間存在著信息壁壘。

  • 數據隱私問題

金融領域的數據對用戶隱私要求較高,去年年底,多家金融大數據公司接連被查,數據安全問題也再一次引發人們的擔憂。

“當手上的信息越多,模型識別的就越準,但風控會與個人隱私保護相衝突,因此既能在保護個人隱私的同時還能做好風控,這是一個非常大的挑戰”,數美科技CTO馮堃告訴InfoQ。據他介紹,針對數據隱私,數美科技目前採用兩種解決方案,一種是業內大規模普遍使用的方法— 對數據進行脫敏處理;團隊也正在探索採用聯邦學習技術。

維擇科技首席諮詢官孫睿在接受InfoQ採訪時表示,法規層面上要求合規經營,首先需要思考的是,開展風控業務是否一定要涉及隱私,涉及過程中是否遵循了法規。先要弄清楚在法規的框架下能做什麼和不能做什麼,至於採用什麼技術,則是第二步需要考慮的問題。

他坦言,儘管金融領域出現了不少隱私保護技術,但目前來看還沒有特別好的、廣泛認可或使用的解決方案。專門用於處理建模過程中隱私數據共享問題的聯邦學習技術最近很火,但該技術尚沒實現大規模落地。

  • 數據孤島

數據孤島的問題一直都存在,未來的一段時間也還會長期存在,市面上還沒有看到特別好的解決方案出現。

  • 依賴大量標註數據

數據標註是深度學習和AI這幾年發展的必然趨勢,當“投餵”的數據越多,效果越好,這也是AI行業最主流的提升效果的方法之一。而這導致的後果就是,所有行業對數據標註的依賴度越來越高。

為解決這一痛點,InfoQ接觸到的兩家公司採用​​了類似的方案。維擇科技會使用一些無監督機器學習模型處理這些問題,其無監督機器學習算法能夠有效發現已知和未知的欺詐形態,在協同的團伙型欺詐攻擊案件中表現不俗,能在大規模攻擊發生前及時攔截,並提供高可解釋性的檢測歸因。為了達到更好的效果,孫睿建議將有監督與無監督組合使用會取得更理想的效果。除採用無監督學習技術外,數美科技也在嘗試小樣本學習等方法。

  • 依賴專家經驗

傳統的風控系統對於專家經驗非常依賴,應用上AI技術後的智能風控體系,在一定程度上緩解了這個問題。

這裡需要明確的是,AI與專家經驗之間的關係並不是非此即彼的。 AI是幫助專家將風控理念落地的工具,而非替代專家。當風險因素、規則特徵繁多,專家經驗管理起來力有不逮時,AI能幫專家從繁複的規則中脫身出來。而在判斷風險點何時何地出現上,專家經驗又不可或缺。

因此,一個公認的解決方案是,要將專家經驗和模型結合起來,二者同時存在,相輔相成,功能互補,互相配合。梁堃覺得,對於大多數金融機構而言,從零搭建起自己的風控系統,現在還做不到一下子完全替換掉專家經驗,短期來看,至少在未來3-5年內不會出現這種情況。

  • 效率問題

機器學習中的模型訓練在過去幾年比較火,大家認為做算法、做模型能夠解決很多問題。但後來發現還存在效率問題,多次的模型訓練會耗時費力。

  • 實現風控的體系化

在搭建風控體系過程中,絕不是單靠一個模型、一個單點就可以識別的,否則很難達到真正抵達風險核心、控制全局風險的效果。想要建立一個體系化的風控系統是比較難的,上來的第一個挑戰便是如何規劃這個體系。

  • 風控的可解釋性

當運營的技術越來越複雜,用到的程序越來越多時,風控的可解釋性就是一大挑戰,因為當判斷一筆交易有風險時需要給出解釋。那麼,對現有的模型如何在做到復雜度的同時做到比較好的解釋性是比較難的。

AI能為“降本增效”做出30%以上貢獻

近年來,傳統金融機構的獲客成本不斷提高,另一方面,黑產分子欺詐的手段也是“道高一尺、魔高一丈”,人機對話、網絡詐騙等新興欺詐手段增多,詐騙方法也漸趨智能化。

黑產的存在令金融機構營銷的效果大打折扣,與傳統的渠道買流量方式相比,線上營銷最終觸達的是C端用戶,如果這些用戶是黑產用來套利的假用戶,那麼將存在損失無法追溯的問題。

以前,銀行對於營銷活動的損失沒多大概念,即便用戶流失低於預期,也很難判別到底有多少營銷費用到了真正的用戶手裡,有多少被黑產套走了。針對新型詐騙方法,AI風控產品能幫助金融機構實現風控效果、降低獲客成本、以及提昇運營效率之間的平衡。

梁堃向InfoQ列舉了2個典型案例。

  • 某A銀行客戶,為拉新用戶投入一筆可觀的營銷費用,費用每天大概在百萬元左右。數美科技的風控產品通過檢測後發現,平均每天有3%-5%的營銷費用被黑產套走,是一筆不小的損失。
  • 某B客戶在營銷活動上線後兩週,提現系統的拒絕率竟出人意料地達到了90%。 “當時我自己也挺害怕的,我在想是不是系統出問題了,怎麼會一下拒絕這麼多”。後來經過調查發現,其實90%被拒絕的用戶基本上都是黑產。

從降本增效的角度考慮,AI技術的應用確實可以起到一定的作用。首先在降低獲客成本上,如在貸款場景中,客戶提交申請到審批的過程中,如需引入外部數據,每調用一次都會產生成本。用AI技術可以做到更精準、更高效的使用這些有成本的環境,這樣就能降低獲客成本。

在“增效”方面,同樣以審批環節為例子,傳統銀行體系需要人工審核,審核人員通常需要看申請表、徵信報告、外部數據等很多材料。如果利用圖譜技術將這些信息整合到一個頁面且以圖像化的形式展示出來,把存在的疑點高亮出來提示調查人員,就能減少人工去不同系統調用數據的時間,提高處理效率。

根據孫睿的經驗判斷,AI風控能夠至少能夠在成本和效率方面有30% 以上的貢獻。

孫睿認為,銀行等金融機構搭建和落地智能風控體系需要具備四大核心能力:

  • 數據的質量和數據的有效打通

這是風控解決方案要想順利落地第一個要解決的關鍵問題。金融行業各個企業數據質量參照不齊,傳統風控流程中多是金融數據或交易數據,而“數據打通”不僅要求金融數據和交易數據,還要包括行為數據、實時產生的數據等,需要具備處理非結構化數據的能力。解決這個問題更多靠企業自發推動,但如何在保證業務發展的同時,把以往的這些歷史包袱解決掉,對企業來說,挑戰和難點重重。

  • 具備底層技術研發能力

為了適應業務創新,底層架構必須具備支持高並發,大量短時內請求的能力。

  • 建適應數字化轉型體系

在數字化、智能化轉型過程中,如何在原有的風控體系上搭建一些適應數字化或智能化轉型的體系,這些同樣也是為了支持業務創新的需要。

  • 專業人才配比

搭建整個智能風控體系需要專業運維人才,因為風控是動態的,不是靜態的,不是搭建完成後就萬事大吉了,而是需要有專業的人才去運用這套體系,不斷完善和查漏補缺,以應對新風險的出現。在技​​術落地的過程中,需要企業或項目團隊有相當的技術人員配比,如果缺少技術人員將會在落地過程中遇到一些挑戰。

AI風控解決方案在金融領域的實際應用過程中,經常遇到的一個難點是,解決方案應該採用哪種方式落地。一些新的技術,很多時候更傾向於雲端部署,但很多企業出於自身運營模式、企業流程規定的考慮,要求本地化部署。在本地化部署的過程中,新技術要適應原有機器的性能、原有軟件的版本,就有可能出現各式各樣的問題,因此,在項目落地的過程中會存在很多理論上考慮不到的情況。

“AI風控產品落地的過程中,最大的挑戰還是大家的意識”,馮堃表示。與四、五年前相比,現在傳統的金融機構對於佈局AI風控的意識提高了很多。

不過有時候客戶的期望與實際達到的效果之間仍存在鴻溝,一些客戶對AI技術賦能期望過高。這是因為對技術的理解不夠全面導致的,AI技術應用到實際操作中後會受到多種因素影響,並非是技術本身不行。因此,在風控意識提高的同時,提高對技術全方位的認知也很有必要。

AI風控是剛需嗎?

自去年9月以來,監管機構加大了對金融機構的合規檢查力度,監管重點多聚焦於數據的合規使用上,以往很多人都偏重大數據產品,大量收集用戶數據,或多或少都會涉及隱私和敏感問題,數據合規壓力很大。

在政策趨嚴之下,金融行業興起一股技術回歸的浪潮,各金融機構愈發重視風控環節中的AI技術能力建設。以往大家過度依賴數據,忽略了AI技術的深度使用,現在隨著監管監管對數據合規使用的要求加強,有利於AI技術本身發揮更多價值。其實AI風控產品/平台也有利於幫助金融機構減輕一些來自監管層面的風險和壓力,例如,控制信用卡的資金流向。當然,AI風控產品是在遵循合規要求的前提下設計的。

不能忽視的是,有些時候,儘管已經施加了最高等級的風險防控手段,但還是難免會出現一些洩密的情況,前文中也已提到了現階段AI風控在技術和落地上所面臨的種種難點,例如,人們擔心AI對於數據的依賴會影響風控效果,也有人擔憂,如果AI技術出現失控情形,是否會影響金融服務質量。

業內有一種聲音質疑,AI風控是否是一個偽命題?針對這一問題,InfoQ詢問了兩位專家的看法。

“其實它已不僅僅是一個方式(工具),它會像在線業務的基礎設施一般,就如同在線業務離不開數據庫、雲主機一樣,未來在線業務也是離不開風控的”,梁堃對AI風控的前景表示非常有信心,他認為,AI風控一定能夠成為剛需。

孫睿亦認為,AI風控是剛需,AI 能夠解決一些傳統銀行體系中存在的痛點問題。首先是人工效率的問題,傳統體系中,人為乾預因素較多,但每個人工作時間有上限。但AI的工作時間不會受到限制,可以24小時工作。其次,AI技術對細化客戶分層的顆粒度及實現精細化管理助力頗多。以往做客戶分層、客戶畫像是基於經驗,基於歷史客戶表現做的風控策略,這些因為受限於人處理事件本身的限制,分層相對有限,客戶畫像的顆粒度比較粗,達不到精細化的管理要求。 AI能夠代替人工處理,能精準用戶畫像,提高風險識別能力。特別是處理大規模的客戶方面,很多國內的銀行都是百萬級、千萬級、上億的客戶,如此大量的客戶不能完全靠一個風控團隊去處理,必須要藉助AI技術進行這種大量級客戶的風險識別工作。

值得注意的是,AI風控對於傳統銀行業的革新並不是“根本性”的變化,“根本性”是要推倒重來,而在傳統銀行的體系下,不可能推倒重來,現有的AI技術也不可能完全替代原有的東西。因為系統存在老舊的狀況,很多新的技術不會被積極利用,加上銀行業務求穩以及政策監管等因素,當技術部門提出一些創新想法的時候,銀行會更多地考慮如何保證現有系統正常運行不出現差錯。因此,用“AI賦能”來形容AI在風控領域所起到的作用更為恰當。

對於接下來,AI金融風控領域的技術和應用的發展趨勢,孫睿判斷,未來3-5年,機器學習、自然語言處理以及知識圖譜等核心技術會有更多場景的落地,他個人比較看好知識圖譜的應用。知識圖譜是實現人工智能的基石,相對於其他技術的落地,對知識圖譜的開墾不是那麼多,因此應該會迎來一個高峰期。現在可以看到很多金融機構,特別是銀行,在應用了其他技術之後,也開始考慮知識圖譜的落地。知識圖譜在風控領域的應用很有前景,在貸前、貸中、貸後這三個環節都可以用到,幫助提高風險識別的能力和效率。

梁堃認為,從應用上看,AI風控會伴隨著金融領域業務在線化的進程,深入到各個領域裡去,不斷擴展、滲透到每個行業中去,除金融之外,還包括,電商、遊戲、醫療、出行等行業。

採訪嘉賓介紹:

梁堃,數美科技聯合創始人&CTO ,北京大學計算機碩士,國內知名機器學習與數據挖掘專家。曾任百度、小米,高級工程師、架構師,擁有多年機器學習和人工智能領域經驗。

孫睿,維擇科技CCO(首席諮詢官):擁有15年中外資銀行風險管理實戰經驗,國內信用卡行業早期從業者,曾服務於中國建設銀行、交通銀行、匯豐銀行。在銀行業務風控領域有著豐富經驗,擅長於零售信貸業務的反欺詐偵測及調查、風險策略制定、風險監控體系建設等方面。近年來,參與和主導了多個風控系統開發和升級項目,推動銀行數字化建設和互聯網轉型。