Google為其自家核心產品建立的差分隱私(Differential Privacy)函式庫,現在對外開源,所有組織和開發人員都可以免費使用。Google提到,這個函式庫重點放在那些難以從頭開始建立的功能,讓開發者可以更簡單地上手,為應用程式加入自動計算使用者貢獻界線等功能。

差分隱私是一種限制演算法,用來防範因為統計資訊發布,進而造成使用者個人資訊外洩的問題。當一個受信任的組織,擁有眾多個人敏感資訊,在對外提供全域性的統計資料時,就會需要用到差分隱私演算法,因為雖然個別資料庫中的資料,並不會對使用者的隱私造成威脅,但是當多個資料庫組合使用,其匿名化等隱私保護技術可能都會失效。

差分隱私提供一個隱私框架,確保組織能從這些資料中獲取資訊,但是又無法區分或是重新辨識出個人資訊。其用途很廣泛,像是政府單位要釋出人口統計資訊,或是企業收集使用者行為,作為內部分析之用時,就需要使用差分隱私演算法,確保最終的統計輸出,不會洩漏特定個人的資訊。

Google釋出的開源專案,包含了ε-差分隱私演算法的C++函式庫,可用於為私密或是敏感資料產生聚合統計資訊,主要功能提供了常見的資料科學操作,開發人員可以使用函示庫提供的計數、總和、平均值、中位數和百分位數等統計功能。

另外,專案還包含了測試程式,Google表示,執行差分隱私是一件有挑戰的工作,因此開發者可以使用專案提供的廣泛的套件進行測試,其中還有一個可擴充的隨機差分隱私模型檢查函式庫,能用來檢查演算法的正確性。Google特別設計了函式庫,使其易於擴充其他功能,增加像是附加機制、聚合功能或是隱私預算管理等功能。

Google目前已經在自家產品廣泛地使用差分隱私方法,像是Google地圖中店家一天的繁忙程度,特定餐廳的餐點在地圖中受歡迎的程度,甚至還用於改進Google Fi。


Advertisement

更多 iThome相關內容