《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于差分隱私的數據脫敏技術研究
基于差分隱私的數據脫敏技術研究
網絡安全與數據治理
李思慧1,戴明超1,蔡伍洲2
1.武警吉林省總隊; 2.武警部隊作戰勤務局
摘要: 隨著人工智能和大數據技術的發展,全球數據產業規模和數據儲量呈爆發式增長。在挖掘數據價值的同時,確保數據安全已成為亟需解決的關鍵問題。數據脫敏技術通過預先設定的規則和算法,對敏感數據進行變換,去除數據中的敏感信息,可防止敏感數據被非法訪問、獲取,又可以減少對整體數據集挖掘利用的影響,實現了保持數據可用性的同時,保護用戶的隱私數據。針對神經網絡預測模型中的數據隱私保護問題,利用差分隱私技術中的Laplace機制對Adult數據集進行脫敏,并在神經網絡預測模型中進行驗證,對比原始數據、差分隱私脫敏數據及其他脫敏技術數據生成模型的預測效果,結果表明,經差分隱私技術處理后的數據,既保證了數據隱私,又實現了數據的有效利用。
中圖分類號:TP309文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.02.006
引用格式:李思慧,戴明超,蔡伍洲. 基于差分隱私的數據脫敏技術研究[J].網絡安全與數據治理,2025,44(2):39-43.
Research on data desensitization technology based on differential privacy
Li Sihui1, Dai Mingchao1,Cai Wuzhou2
1.Jilin Armed Police Corps; 2.Combat Service Bureau, People′s Armed Police
Abstract: With the development of artificial intelligence and big data technology, the global data industry is experiencing explosive growth in scale and data reserves. Ensuring data security while mining its value has become a critical issue that urgently needs to be solved. Data desensitization technology transforms sensitive data with preset rules and algorithms, removing sensitive information from the data, preventing illegal access and acquisition of sensitive data, and reducing the impact on the overall data set mining and utilization, achieving privacy protection while maintaining data availability.This article addresses the issue of data privacy protection in neural network prediction models. The Laplace mechanism in differential privacy technology is used to desensitize the Adult data set and validated in the neural network prediction model. Comparing the predictive performance of the original data, differential privacysanitized data, and models generated from other desensitization techniques data, the results show that the data processed by differential privacy technology not only ensures data privacy but also achieves effective utilization of the data.
Key words : data desensitization; differential privacy; Laplace mechanism

引言

當前,人工智能、大模型、大數據技術飛速發展,數據是各項技術構建的關鍵基礎資源,全球數據產業正在呈爆發式增長。據國際數據公司(IDC)預測,2018~2025年,全球數據量將從33 ZB猛增至175 ZB,而根據工業和信息化部相關預測,2021~2025年,我國的大數據產業規模將從1.3萬億元突破至3萬億元,數據已然成為推動經濟社會發展最重要的基礎生產要素之一[1]。數據資源被充分利用的同時,數據安全問題也日益凸顯,數據被非法獲取事件頻頻發生,給企業和個人帶來了巨大損失。因此,在挖掘數據價值的同時,確保數據安全,已成為亟需解決的關鍵問題。

傳統的數據安全解決方案大多關注于數據的存儲和傳輸,在對數據進行挖掘利用時,仍然需要具有敏感信息的原始數據,數據非法竊取者可通過身份攻擊、屬性攻擊、存在性攻擊和概率知識攻擊等,推斷出個體敏感信息[2]。數據脫敏技術是通過對數據進行一定處理來保護隱私的技術,其目的是在保留輸入數據的統計特征以及可用性的同時,保護數據的隱私和安全[3]。差分隱私技術是數據脫敏技術的一種,該技術提供了一種隱私保護方法,旨在向原始數據注入噪聲或擾動,實現在保護個體數據隱私的同時,完成對數據的挖掘利用[4]。

差分隱私技術在國外研究較早,且技術日趨成熟。2006年,Dwork等人[5]首次提出了差分隱私保護方法,該方法通過向原始數據添加服從特定分布的噪聲,用以保護敏感數據,解決了傳統數據匿名脫敏技術無法抵抗背景知識攻擊的問題。2016年,Abadi等人[6]提出了具有差分隱私的深度學習算法,分析了差分隱私在深度學習框架內的隱私成本,在保護數據隱私的同時,訓練出有效的深度學習模型。2019年,Holohan等人[7]設計了IBM差分隱私庫,用于Python編程語言中研究、實驗和開發差分隱私應用程序。2023年,Holohan[8]又提出了差分隱私隨機數生成器和種子算法,實現了在差分算法和結果中進行測試和錯誤修復,為差分隱私算法選擇提供了有利幫助。

近年來,國內的差分隱私技術研究也取得了豐碩成果。2009年,袁進良[9]設計了統一的差分隱私聯邦學習平臺,擴展了傳統的隱私預算組合定理,實現了隨時間不斷更新的可用預算,解決了差分隱私的強隱私和聯邦系統的高吞吐難兼顧問題。2023年,張連福[10]提出了一種基于同態加密與差分隱私的隱私保護聯邦學習方案,利用多種防護措施實現了隱私防護范圍覆蓋聯邦學習全生命周期。同年,張旭[11]提出一種兼顧安全防御和隱私保護的分布式學習系統,該系統實現隱私保護的同時,提升了訓練模型的準確性。隨著差分隱私技術的不斷迭代發展,其在數據隱私保護領域得到越來越多的應用。

本文探討基于差分隱私的數據脫敏方法,對數據集進行清洗整理后,利用Laplace機制對敏感數據進行處理,利用神經網絡模型分別對未脫敏數據和脫敏后的數據進行訓練和預測,對比原始數據、差分隱私脫敏數據及其他脫敏技術數據生成模型的預測效果,為神經網絡預測模型的數據隱私保護問題提供解決方案。


本文詳細內容請下載:

http://www.rjjo.cn/resource/share/2000006341


作者信息:

李思慧1,戴明超1,蔡伍洲2

(1.武警吉林省總隊,吉林長春130000;

2.武警部隊作戰勤務局,北京100000)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 日韩经典中文字幕 | 免费一级视频在线播放 | 国产精品亚洲欧美日韩久久 | 国产精品久久久久影院色老大 | 99久久精品国产亚洲 | 欧美一区二区在线 | 欧美成人精品福利在线视频 | 国产精品莉莉欧美自在线线 | 热99re久久精品香蕉 | 国产精品视频第一区二区三区 | 国产精品亲子乱子伦xxxx裸 | 久久久久免费精品国产 | 奇米四色综合久久天天爱 | 精品少妇一区二区三区视频 | 日韩免费观看一级毛片看看 | 精品视频一区二区 | 九九国产精品 | 欧美一区二区三区国产精品 | 亚洲美女在线播放 | 久久久国产一区二区三区 | 日韩精品三级 | 国产三级在线观看免费 | 美女张开腿黄网站免费国产 | 6080伦理久久精品亚洲 | 成人欧美网站免费 | 亚洲国产精品综合久久 | 波多野结衣在线不卡 | 国产亚洲精品日韩已满十八 | 爱啪网亚洲第一福利网站 | 亚洲欧美一区二区三区在线 | 精品9e精品视频在线观看 | 国产精品黄网站 | 国产午夜永久福利视频在线观看 | 成人国产在线视频在线观看 | 久久99国产亚洲高清观看韩国 | 国产高颜值露脸在线观看 | 成人精品在线观看 | 日韩一区国产二区欧美三 | 欧美怡红院免费全视频 | 久久视频免费 | 特级淫片国产免费高清视频 |