谷歌開源差異化隱私庫

  • 2019 年 10 月 4 日
  • 筆記

谷歌前兩日發佈了其核心產品(如谷歌Maps)中使用的差別隱私庫的開源版本,任何組織或開發人員現在都可以在GitHub上查看隱私庫,此舉給業內造成了不小的影響。

差異隱私算法

差異隱私限制了用於發佈統計數據庫聚合信息的算法,無論您是城市規劃師、小型企業所有者還是軟件開發人員,您大概都會希望從您的公民、客戶或用戶的數據中獲得信息。但這個過程涉及隱私,如果你不想失去他們對這個過程,以及對你的信任,就得另想辦法,而這時,差異私有數據分析正好能幫到你,它可以使組織能夠從大多數數據中學習,而不需要區分或重新標識任何單個個體的數據。

谷歌產品經理米格爾•格瓦拉解釋說:「如果你是一名健康研究人員,那麼你可以通過比較不同醫院的病人平均住院時間,以確定各院在護理方面是否存在差異。」「差異隱私是一種高保證、分析性的方法,可以確保以保護隱私的方式處理類似的案例。」

差異化隱私庫功能

谷歌承諾,它的庫對於開發人員而言很簡單。主要特點包括:

統計功能:支持最常見的數據科學操作(計數、總和、平均值、中間值和百分位數)。

嚴格的測試:除了一個擴展的測試套件,還有一個可擴展的「隨機差異隱私模型檢查器庫」有助於防止錯誤。

準備使用:包括一個postgresql擴展和常見的方法。

模塊化:庫可以擴展到包括其他功能,如附加機制、聚合功能或隱私預算管理。

這並不是谷歌的第一次差異化隱私競技。3月,谷歌發佈了TensorFlow Privacy和TensorFlow Federated。6月,谷歌開放了源代碼的私有連接和計算,在保護隱私的同時為公司提供數據洞察。本月,又來了個差異化隱私庫,今年的谷歌似乎特別忙碌。

GitHub:

https://github.com/google/differential-privacy/tree/master/differential_privacy

End