Categories
程式開發

如何讓數據安全地發揮其真正價值?


你是否經歷過這樣的場景:和朋友在聊天軟件上說著夏天到了,該減肥了。再去打開購物軟件的時候,發現首頁上多了許多瑜伽墊、彈力帶等運動用品的推薦;或許你對這樣的“現代科技”驚嘆過,抑或許你對這樣的“實時監控”驚慌過,但由於這樣的事情已經屢見不鮮了,所以你從未因此申訴過自己的數據被“竊取”了。

各類囊括了我們衣食住行需求的App讓我們的生活更加便捷,電子商務、新零售、物流業也被注入了蓬勃發展的動力。

與此同時App的數據安全問題也日益暴露出來,前有第三方iOS程序私自監控剪貼板,後有315晚會上央視點名某些手機App盜竊隱私。

各大類App都或多或少存在一些數據安全問題,只是這些問題掩蓋在了App帶給我們的便利之下。

如何讓數據安全地發揮其真正價值? 1

各大類App信息安全平均問題數統計數據來源:信通院《移動應用(App)數據安全與個人信息保護白皮書》

其實我國對公民的隱私安全問題也逐步重視起來,去年已經印發了《App違法違規收集使用個人信息行為認定方法》,即使App經過我們的同意獲取到了我們的相關隱私數據,但也無權轉讓給其他App。

但是在安全合規的情況下,如何保證我們的生活依舊便捷呢?聯邦學習不失為一個解決辦法。

聯邦學習是什麼?

聯邦學習就是通過聯合多方,在不洩露或匯聚各方原始數據的前提下進行聯合建模的一種機器學習框架。

如何讓數據安全地發揮其真正價值? 2

聯邦學習框架

當兩個不同地區銀行的信貸風險部門因為數據量不足以及數據行為不具有普遍性而無法建立合適的信貸風險模型來進行風險防控時,可能兩個銀行用戶不同但其業務特徵重疊較多,我們就可以使用**橫向聯邦學習**賦能兩家銀行的信貸業務。

當某地區的銀行因為弱識別用戶的銀行APP活躍度不夠或數據行為覆蓋較少而對給其放貸猶豫不決時,則可以引入同一用戶群體在電商平台的消費數據和其他金融機構的相關數據,再運用縱向聯邦學習進行建模,從而能夠有效降低不良貸款率。

而對於用戶重疊較少且業務特徵也重疊較少的兩企業,若想利用雙方數據賦能各自業務線,則可以使用橫縱結合的聯邦學習

如何讓數據安全地發揮其真正價值? 3

三類聯邦學習

聯邦學習中進行交換的數據是經過加密的模型或梯度,其他人是無法通過這些信息反推出參與方的原始數據的,因而聯邦學習在解決數據孤島問題時具有良好的隱私保護機制。

同時,聯邦學習中建立的激勵和利益分配機制,讓各企業都有動力參與其中,並且都能根據其對聯邦任務的貢獻程度而獲得應有的利益。

聯邦學習在Sophon上的演繹

為了幫助客戶實現隱私保護與數據應用上的平衡以及解決在某些領域存在的數據孤島問題,Sophon也提出了自己的聯邦學習框架Sophon FL。

如何讓數據安全地發揮其真正價值? 4

Sophon FL框架

在底層的數據和設備層中,該框架會支持CPU、GPU集群,以及多種類型的輸入數據源;

底層上一層是加密層和計算後端層,在此我們會支持同態加密和差分隱私等加密方式,以及Spark、Tensorflow、Pytorch等多種計算框架。這樣的設計讓使用不同後端計算引擎的客戶都能參與到Sophon FL上的聯邦任務中;

再上一層即是聯邦學習計算層,其支持基本的安全計算以及在此之上的不同種類的模型訓練和聯邦學習任務,讓不同場景的數據安全應用要求都盡可能得到滿足;

在最上層的應用層中,我們會支持諸如反洗錢、反欺詐、風控和精準營銷等場景,聯邦風控、聯邦營銷、聯邦安防等不會是紙上談兵了。

Sophon FL為用戶提供多樣化選擇

多元化的計算框架能夠支持如Sophon,Spark等多種計算框架;多元化的硬件設備讓你本地的CPU、GPU等多種硬件設備都能得到支持;多元化的算法種類使得多種聯邦計算算法和聯邦優化算法都能助力你的智慧化轉型大業;多元化的隱私保護讓你不論是在《數據安全管理辦法》的考驗下,還是在GDPR的管控下,都不會有數據使用侵權的嫌疑。

Sophon FL看板展示

“兩易兩高”便於操作:交互式的操作界面以及清晰化的功能設計讓Sophon FL易於上手;看板管理讓每條聯邦學習任務的狀態和進程易追踪;良好的通信效率讓加密的模型或梯度都能得到高效傳輸;無論是多種聯邦學習算法保障的建模效果,還是全流程建模和模型上線的支持,都能讓用戶體驗高效建模。

實踐示例

假設有兩個信貸管理部門,分別來自上海的銀行A和北京的銀行B,他們都面臨同樣的兩個問題,本行信貸檔案數據量不足以及相關信貸數據不具有普遍性。如果把A、B的數據進行匯聚再建模確實能解決以上兩個問題,但同時也將銀行的用戶隱私進行了洩露,可能面臨與“池子狀告中信銀行”相似的場面。而利用Sophon FL則能既進行隱私保護又能讓兩家銀行合法合規地通過聯邦計算模型去判斷客戶的貸款資質和信用情況,實現聯邦信貸風控。

數字經濟時代,數據既是創造財富的關鍵,也是智慧化轉型的必需,與此同時數據安全及隱私保護也不可忽視。