揭秘:支付寶是如何保護你的隱私的?

  • 2019 年 12 月 2 日
  • 資訊

你的臉值多少錢?

萬萬沒想到,你的“臉”可能出現在二手買賣平台上。

央視新聞報道,近日,在互聯網平台“轉轉”上以關鍵詞“人臉數據集”搜索相關資訊,迅速彈出了這樣一件產品。商品名為“人臉相關演算法訓練數據集”,標價 10 元。打開商品介紹後看到,這個數據集包含五千多張人臉照片。很多還是一個人不同表情的臉部照片。

揭秘:支付寶是如何保護你的隱私的?

除非法兜售外,多款 App 還存在著隨意收集人臉數據資訊的情況。

對此,網友也分化為兩種態度,一種較為樂觀認為“AI時代下,安全與自由總有一個要失去”;一類則較為恐慌,認為刷臉支付不能完全被信服。

在刷臉支付上用得一向 666 的螞蟻金服也被隔空喊話。

揭秘:支付寶是如何保護你的隱私的?

除了井賢棟出來回答,直接說如果因為他們的原因造成損失,全賠,不設上限。11 月 28 日,在 2019 CIS 網路創新安全大會金融科技專場上,螞蟻金服高級演算法專家薛峰介紹了螞蟻金服在數據安全和隱私保護方面的做法。

這裡也許能探究到螞蟻金服做出“全賠承諾”的底氣。

據薛峰介紹,螞蟻金服主要用 TED ENGINE 引擎來做數據安全與隱私保護。具體是如何來保護呢,雷鋒網將其總結為以下三個方面:

揭秘:支付寶是如何保護你的隱私的?

Tag:敏感數據智慧打標技術,通過事先打標,分類後識別敏感數據,主要是用NLP、CV、C-ML技術,還有標準化服務。

Enhace:AI安全增強技術,用差分、可信硬體保護數據、模型

Detection:智慧威脅識別技術,主要圍繞內部威脅、Bot Detection反爬、經典安全問題、AI Attack Detection

1、Tag

Tag一般分為4種類型,分別是文字類、影像類、密鑰類和ID類,數據分門別類後,下一步就可以對其進行識別引擎。以影像類為例,首先可以用ResNet、OCR技術識別,然後進行打標,完成敏感數據的識別,識別出來之後為其做標準化服務。其實,核心就是將這類資訊變成API、SDK,跟各個業務系統做集成。

2、Enhace

Enhace,其實就是我們經常所說的 AI 安全增強技術。以深度學習為例,深度學習是一個數據驅動的技術,它可以挖掘許多人眼無法識別的模型,一旦模型被泄露,圍繞模型中的特徵就可以逆推出最原始的那張照片,想想都闊怕,那麼螞蟻金服如何做呢?他們要做的很簡單,其實就是介入干擾,那麼整個圖片識別系統就會出錯。

此外,在Enhace這個方向,還有一個叫做PPML的技術,即隱私保護的機器學習技術。值得一提的是,  這在學術圈還是一個比較新的領域,主要有機器學習和安全動畫計算、同態加密、機器學習技術和可信  硬體怎樣結合、中心式的分布和去中心化訓練技術、差分隱私等。

對於螞蟻金服而言,差分隱私和可信硬體是螞蟻金服在數據安全和隱私保護領域重點開發方向。

差分隱私的主要做法是在原始數據集中增加雜訊,在不影響統計分析的前提下,防止個人隱私數據泄露。 

舉個例子,比如說一個數據公司提供了一萬個人的年齡數據,如果不加雜訊或者差分隱私,那麼黑客就可以輕鬆反推出其他的數據,反之,如果加上雜訊或者差分隱私就沒有辦法反推隱私,進而保護了個人隱私。

那可信硬體又是怎麼回事呢?現在很多手機都有指紋識別或者人臉識別,但是指紋識別是需要原始的指紋數據的,廠商是不能把指紋數據上傳到雲的,所以他們開發了一個硬體區域,通過RAM的協議保護指紋數據,甚至可以把機器學習、深度學習模型放進去,進而保護數據安全。

3、Detection

Detection主要做智慧威脅識別技術。主要圍繞四個方面,一是內部威脅,就是員工的意識問題,很多數據泄露是員工的意識薄弱最終導致泄露的,比如說敏感數據文件外發了,或者是員工查了一些不該查的東西;第二個是Bot Detection反爬;第三是經典的安全問題;第四個是AI Attack Detection。

此外,對於近期的人臉支付是否存在風險的問題,螞蟻金服董事長井賢棟也公開回應:支付寶的刷臉支付數據是不會保存在本地的,不會有人接觸到這些數據。而且,“數據被編碼以後,放在系統裡面,數據沒有人觸及,也不可以回溯到人臉”。這樣看來,支付寶刷臉支付安全性還是可以保障的,不過,在數據安全與隱私保護這條路上螞蟻金服還有很長的路要走。

揭秘:支付寶是如何保護你的隱私的?