Google開源用於自家核心產品的差分隱私函式庫

Google為其自家核心產品建立的差分隱私（Differential Privacy）函式庫，現在對外開源，所有組織和開發人員都可以免費使用。Google提到，這個函式庫重點放在那些難以從頭開始建立的功能，讓開發者可以更簡單地上手，為應用程式加入自動計算使用者貢獻界線等功能。

差分隱私是一種限制演算法，用來防範因為統計資訊發布，進而造成使用者個人資訊外洩的問題。當一個受信任的組織，擁有眾多個人敏感資訊，在對外提供全域性的統計資料時，就會需要用到差分隱私演算法，因為雖然個別資料庫中的資料，並不會對使用者的隱私造成威脅，但是當多個資料庫組合使用，其匿名化等隱私保護技術可能都會失效。

差分隱私提供一個隱私框架，確保組織能從這些資料中獲取資訊，但是又無法區分或是重新辨識出個人資訊。其用途很廣泛，像是政府單位要釋出人口統計資訊，或是企業收集使用者行為，作為內部分析之用時，就需要使用差分隱私演算法，確保最終的統計輸出，不會洩漏特定個人的資訊。

Google釋出的開源專案，包含了ε-差分隱私演算法的C++函式庫，可用於為私密或是敏感資料產生聚合統計資訊，主要功能提供了常見的資料科學操作，開發人員可以使用函示庫提供的計數、總和、平均值、中位數和百分位數等統計功能。

另外，專案還包含了測試程式，Google表示，執行差分隱私是一件有挑戰的工作，因此開發者可以使用專案提供的廣泛的套件進行測試，其中還有一個可擴充的隨機差分隱私模型檢查函式庫，能用來檢查演算法的正確性。Google特別設計了函式庫，使其易於擴充其他功能，增加像是附加機制、聚合功能或是隱私預算管理等功能。

Google目前已經在自家產品廣泛地使用差分隱私方法，像是Google地圖中店家一天的繁忙程度，特定餐廳的餐點在地圖中受歡迎的程度，甚至還用於改進Google Fi。

熱門新聞