對網路嵌入的隱私攻擊

  • 2019 年 12 月 29 日
  • 筆記

原文題目: Privacy Attacks on Network Embeddings

摘要: 數據所有權和數據保護越來越成為具有倫理和法律意義的重要議題,例如,在《歐盟通用數據保護條例》(GDPR)中確立的刪除權。在此基礎上,我們研究了網路嵌入,即將網路節點表示為低維向量。我們考慮了一個典型的社交網路場景,其中節點代表用戶,邊緣代表用戶之間的關係。我們假設已經訓練了節點的網路嵌入。之後,用戶要求刪除其數據,要求完全刪除相應的網路資訊,特別是相應的節點和事件邊緣。在該設置中,我們分析在將節點從網路中移除並且在嵌入有關移除節點的鏈路結構的重要資訊中刪除相應節點的向量表示之後,是否仍在剩餘節點的嵌入向量中編碼。這將需要對嵌入進行重新訓練(可能需要計算代價)。為此,我們部署了一個攻擊,該攻擊利用來自剩餘網路的資訊並嵌入以恢復有關已刪除節點的相鄰資訊。攻擊基於(i)測量網路嵌入中的距離變化和(ii)一個機器學習分類器,該分類器在通過移除額外節點構建的網路上進行訓練。我們的實驗表明,關於被移除節點/用戶的邊緣的實質性資訊可以跨許多不同的數據集進行檢索。這意味著,為了充分保護用戶的隱私,節點刪除需要對原始網路嵌入進行完全的重新培訓,或者至少是重大的修改。我們的結果表明,從隱私的角度來看,僅僅從網路嵌入中刪除相應的向量表示是不夠的。

原文作者:Michael Ellers, Michael Cochez, Tobias Schumacher, Markus Strohmaier, Florian Lemmerich

原文地址:https://arxiv.org/abs/1912.10979