差分隱私是一個隱私安全的特征共享方法,通過僅分享數(shù)據(jù)庫中的一些統(tǒng)計特征,而不公開特定實體信息,來達(dá)到保護(hù)隱私安全的目的。 差分隱私這項匿名化技術(shù),能夠應(yīng)用在機(jī)器學(xué)習(xí)推理和共享數(shù)據(jù)用例上,包括廣告、金融、醫(yī)療保健和教育行業(yè)應(yīng)用,皆會使用差分隱私進(jìn)行數(shù)據(jù)分析,并免暴露個人紀(jì)錄。
谷歌在2019年發(fā)布將差分隱私技術(shù)應(yīng)用在數(shù)據(jù)庫的重要研究,其目標(biāo)是希望差分隱私能夠確保數(shù)據(jù)庫查詢的結(jié)果,不會泄漏數(shù)據(jù)庫中任何個體的過多信息。 這項研究的重要性在于,過去差分隱私都僅停留在科學(xué)研究階段,真正完整的差分隱私查詢引擎很少,而谷歌的這項研究則將差分隱私帶進(jìn)實際應(yīng)用中。
差分隱私用于實際系統(tǒng)之所以存在挑戰(zhàn),在于差分隱私系統(tǒng)常假設(shè)每個個體最多只與一條數(shù)據(jù)庫記錄相關(guān)聯(lián),但在數(shù)據(jù)庫實際應(yīng)用上并非如此,谷歌提出在數(shù)據(jù)庫中進(jìn)行差分隱私聚合的方法,這是一個通用且可擴(kuò)展的方法,每個個體可以和任意行數(shù)的數(shù)據(jù)相關(guān)聯(lián)。
谷歌在發(fā)布差分隱私論文的同時,也開源了自家核心產(chǎn)品中所使用的差分隱私函式庫,包括谷歌的廣告資料中心,以及疫情社區(qū)人流趨勢報告,都使用了這個函式庫。
現(xiàn)在谷歌進(jìn)一步擴(kuò)展自家產(chǎn)品對差分隱私的支持,利用差分隱私函式庫,在BigQuery加入這項隱私保護(hù)功能,優(yōu)點除了提升數(shù)據(jù)應(yīng)用隱私保護(hù)之外,也能協(xié)助企業(yè)符合法遵要求,而且因為差分隱私與其他隱私保護(hù)技術(shù)相比,更能保留數(shù)據(jù)的統(tǒng)計特性和可用性,因此企業(yè)在保護(hù)用戶隱私的同時,仍可以對資料進(jìn)行分析,挖掘有價值的信息。
谷歌提到,之后他們還會在BigQuery資料無塵室中整合差分隱私,使企業(yè)能夠以更具隱私安全的方式共享敏感資料。