信息网络安全 ›› 2024, Vol. 24 ›› Issue (11): 1731-1738.doi: 10.3969/j.issn.1671-1122.2024.11.012
收稿日期:
2024-07-05
出版日期:
2024-11-10
发布日期:
2024-11-21
通讯作者:
顾海艳 作者简介:
顾海艳(1970—),女,江苏,教授,硕士,主要研究方向为信息安全|柳琪(2000—),男,江苏,本科,主要研究方向为网络安全与执法|马卓(1993—),女,山西,讲师,博士,CCF会员,主要研究方向为信息安全、用户隐私|朱涛(1982—),男,四川,副教授,博士,主要研究方向为大数据技术|钱汉伟(1982—),男,江苏,高级工程师,硕士,主要研究方向为信息安全
基金资助:
GU Haiyan1(), LIU Qi2, MA Zhuo1, ZHU Tao1, QIAN Hanwei1
Received:
2024-07-05
Online:
2024-11-10
Published:
2024-11-21
摘要:
随着信息技术的加速发展,数据隐私保护逐渐成为研究热点。如何有效保护个人隐私并充分利用各种数据资源,成为亟待解决的问题。利用数据加噪实现隐私保护是目前较常用的方法之一,但目前缺乏对不同加噪方法对数据可用性影响的研究。文章对反映用户体验的“五星制”评价数据分别添加拉普拉斯噪声和高斯噪声,比较分析加噪后数据的平均绝对误差、均方根误差、方差增长率3个统计指标的变化情况。然后探讨添加两种噪声比例变化的组合噪声以及不同数据量对数据统计指标的影响规律。实验结果表明,当数据量较大时,添加高斯噪声的数据比例越大,加噪后数据的统计性能与原始数据越接近,能在实现个人隐私保护的同时,更好地保证数据的可用性。
中图分类号:
顾海艳, 柳琪, 马卓, 朱涛, 钱汉伟. 基于可用性的数据噪声添加方法研究[J]. 信息网络安全, 2024, 24(11): 1731-1738.
GU Haiyan, LIU Qi, MA Zhuo, ZHU Tao, QIAN Hanwei. Research on Data Noise Addition Method Based on Availability[J]. Netinfo Security, 2024, 24(11): 1731-1738.
表5
不同比例噪声的实验分析结果
添加高斯噪声的比例η | 平均绝对误差 | 均方根误差 | 方差增长率 |
---|---|---|---|
0 | 0.121 | 0.172 | 3.06% |
5% | 0.122 | 0.167 | 3.01% |
10% | 0.120 | 0.165 | 2.69% |
15% | 0.119 | 0.164 | 2.52% |
20% | 0.118 | 0.162 | 3.04% |
25% | 0.118 | 0.162 | 4.48% |
30% | 0.115 | 0.159 | 5.94% |
35% | 0.115 | 0.157 | 5.41% |
40% | 0.116 | 0.158 | 5.70% |
45% | 0.112 | 0.152 | 2.19% |
50% | 0.113 | 0.153 | 2.80% |
55% | 0.108 | 0.149 | 4.07% |
60% | 0.106 | 0.146 | 3.13% |
65% | 0.100 | 0.136 | 1.97% |
70% | 0.097 | 0.132 | 1.54% |
75% | 0.099 | 0.134 | 1.83% |
80% | 0.096 | 0.125 | 0.47% |
85% | 0.100 | 0.128 | 0.59% |
90% | 0.100 | 0.127 | 0.91% |
95% | 0.096 | 0.120 | 1.60% |
100% | 0.090 | 0.117 | 0.96% |
表6
4种数据量情况下的实验结果
高斯噪声比例 | 100个数据 | 500个数据 | ||||
---|---|---|---|---|---|---|
平均绝对误差 | 均方根 误差 | 方差 增长率 | 平均绝对误差 | 均方根 误差 | 方差 增长率 | |
0 | 0.121 | 0.172 | 3.06% | 0.112 | 0.112 | 1.41% |
20% | 0.118 | 0.162 | 3.04% | 0.110 | 0.109 | 0.28% |
40% | 0.116 | 0.158 | 5.70% | 0.107 | 0.104 | 0.29% |
60% | 0.106 | 0.146 | 3.13% | 0.102 | 0.093 | 0.52% |
80% | 0.096 | 0.125 | 0.47% | 0.101 | 0.090 | 0.80% |
100% | 0.090 | 0.117 | 0.96% | 0.097 | 0.084 | 0.51% |
高斯噪声比例 | 1000个数据 | 2000个数据 | ||||
平均绝对误差 | 均方根 误差 | 方差 增长率 | 平均绝对误差 | 均方根误差 | 方差 增长率 | |
0 | 0.113 | 0.160 | 1.86% | 0.123 | 0.176 | 3.48% |
20% | 0.112 | 0.156 | 2.18% | 0.118 | 0.167 | 2.52% |
40% | 0.106 | 0.143 | 0.89% | 0.112 | 0.157 | 2.27% |
60% | 0.105 | 0.141 | 0.41% | 0.107 | 0.145 | 2.25% |
80% | 0.101 | 0.129 | 0.04% | 0.101 | 0.133 | 1.48% |
100% | 0.098 | 0.123 | 0.03% | 0.097 | 0.126 | 1.35% |
[1] | SHAO Guosong. Psycho-Graphic Profiling: What Can Be Learned from Cambridge Analytica[J]. Media Observer, 2021, 455(11): 45-49. |
邵国松. 心理绘图与用户画像:剑桥分析的兴亡启示录[J]. 传媒观察, 2021, 455(11): 45-49. | |
[2] | QIAN Wenjun, SHEN Qingni, WU Pengfei, et al. Research Progress on Privacy-Preserving Techniques in Big Data Computing Environment[J]. Chinese Journal of Computers, 2022, 45(4): 669-701. |
钱文君, 沈晴霓, 吴鹏飞, 等. 大数据计算环境下的隐私保护技术研究进展[J]. 计算机学报, 2022, 45(4): 669-701. | |
[3] |
LI Hongtao, REN Xiaoyu, WANG Jie, et al. Continuous Location Privacy Protection Mechanism Based on Differential Privacy[J]. Journal on Communications, 2021, 42(8): 164-175.
doi: 10.11959/j.issn.1000-436x.2021123 |
李洪涛, 任晓宇, 王洁, 等. 基于差分隐私的连续位置隐私保护机制[J]. 通信学报, 2021, 42(8): 164-175.
doi: 10.11959/j.issn.1000-436x.2021123 |
|
[4] | DWORK C. Differential Privacy[C]// Springer. International Colloquium on Automata, Languages, and Programming. Heidelberg: Springer, 2006: 1-12. |
[5] |
ZHANG Xuejun, YANG Haoying, LI Zhen, et al. Differentially Private Location Privacy-Preserving Scheme with Semantic Location[J]. Computer Science, 2021, 48(8): 300-308.
doi: 10.11896/jsjkx.200900198 |
张学军, 杨昊英, 李桢, 等. 融合语义位置的差分私有位置隐私保护方法[J]. 计算机科学, 2021, 48(8): 300-308.
doi: 10.11896/jsjkx.200900198 |
|
[6] |
HUANG Haiping, WANG Kai, TANG Xiong, et al. Differential Privacy Protection Scheme Based on Edge Betweenness Model[J]. Journal on Communications, 2019, 40(5): 88-97.
doi: 10.11959/j.issn.1000-436x.2019095 |
黄海平, 王凯, 汤雄, 等. 基于边介数模型的差分隐私保护方案[J]. 通信学报, 2019, 40(5): 88-97.
doi: 10.11959/j.issn.1000-436x.2019095 |
|
[7] |
WANG Li’e, LI Xiaocong, LIU Hongyi. News Recommendation Method with Knowledge Graph and Differential Privacy[J]. Journal of Computer Applications, 2022, 42(5): 1339-1346.
doi: 10.11772/j.issn.1001-9081.2021030527 |
王利娥, 李小聪, 刘红翼. 融合知识图谱和差分隐私的新闻推荐方法[J]. 计算机应用, 2022, 42(5): 1339-1346.
doi: 10.11772/j.issn.1001-9081.2021030527 |
|
[8] | LIU Kai, HAN Yiliang, GUO Kaiyang, et al. Differential Privacy Trajectory Protection Mechanism Based on DBSCAN Clustering Algorithm[J]. Science Technology and Engineering, 2022, 22(25): 11091-11096. |
刘凯, 韩益亮, 郭凯阳, 等. 基于密度的噪声应用空间聚类算法的差分隐私轨迹保护机制[J]. 科学技术与工程, 2022, 22(25): 11091-11096. | |
[9] | WEI Kang, LI Jun, DING Ming, et al. Federated Learning with Differential Privacy: Algorithms and Performance Analysis[J]. IEEE Transactions on Information Forensics and Security, 2020, 15: 3454-3469. |
[10] | SONG Cheng, CHENG Daochen, NI Shuiping. k Anonymous Trajectory Privacy Protection Scheme of Personalized Differential Privacy[J]. Journal of Beijing University of Posts and Telecommunications, 2023, 46(3): 109-114. |
宋成, 程道晨, 倪水平. 个性化差分隐私的k匿名轨迹隐私保护方案[J]. 北京邮电大学学报, 2023, 46(3): 109-114. | |
[11] |
LI Kejia, HU Xuexian, CHEN Yue, et al. Differential Privacy Linear Regression Algorithm Based on Principal Component Analysis and Functional Mechanism[J]. Computer Science, 2023, 50(8): 342-351.
doi: 10.11896/jsjkx.220800255 |
李可佳, 胡学先, 陈越, 等. 基于主成分分析和函数机制的差分隐私线性回归算法[J]. 计算机科学, 2023, 50(8): 342-351.
doi: 10.11896/jsjkx.220800255 |
|
[12] | XU Yahong, YANG Geng, BAI Yunlu, et al. Differential Privacy Data Publish Algorithm for Principal Component Analysis[J]. Cyberspace Security, 2018, 9(10): 74-82. |
徐亚红, 杨庚, 白云璐, 等. 面向主成分分析的差分隐私数据发布算法[J]. 网络空间安全, 2018, 9(10): 74-82. | |
[13] | YANG Jun, ZHOU Juling. Restore of Mathematical Detail: The Process of Gauss Deriving the Probability Density Function of Normal Distribution[J]. Journal of Statistics and Information, 2019, 34(6): 17-21. |
杨军, 周菊玲. 还原数学细节:高斯推导正态分布概率密度函数的过程[J]. 统计与信息论坛, 2019, 34(6): 17-21. | |
[14] | ROY I, SETTY S T V, KILZER A, et al. Airavat:Security and Privacy for MapReduce[C]// USENIX. Proceedings of the 7th USENIX Symposium on Networked Systems Design and Implementation. Berkeley: USENIX, 2010: 297-312. |
[15] | BAO Ting, XU Lei, ZHU Liehuang, et al. Optimized Setting of Privacy Budget in a Recommendation System with Local Differential Privacy[J]. Scientia Sinica (Informationis), 2022, 52(8): 1481-1499. |
暴婷, 徐蕾, 祝烈煌, 等. 满足本地化差分隐私的推荐系统中隐私预算的优化设置[J]. 中国科学:信息科学, 2022, 52(8): 1481-1499. | |
[16] | YAN Yan, ZHANG Xiong, FENG Tao. Proportional Differential Privacy Budget Allocation Method for Partition and Publishing of Statistical Big Data[J]. Netinfo Security, 2022, 22(11): 24-35. |
晏燕, 张雄, 冯涛. 大数据统计划分发布的等比差分隐私预算分配方法[J]. 信息网络安全, 2022, 22(11): 24-35. | |
[17] |
ZHANG Xing, ZHANG Xing, WANG Qingyang. DP-IMKP: Data Publishing Protection Method for Personalized Differential Privacy[J]. Computer Engineering and Applications, 2023, 59(10): 288-298.
doi: 10.3778/j.issn.1002-8331.2201-0457 |
张星, 张兴, 王晴阳. DP-IMKP:满足个性化差分隐私的数据发布保护方法[J]. 计算机工程与应用, 2023, 59(10): 288-298.
doi: 10.3778/j.issn.1002-8331.2201-0457 |
|
[18] | WANG Chao. Personalized Recommendation Techniques and Applications Based on User Decision-Making Behaviors[D]. Hefei: University of Science and Technology of China, 2022. |
王超. 基于用户决策行为的个性化推荐方法及应用研究[D]. 合肥: 中国科学技术大学, 2022. | |
[19] | DWORK C, ROTH A. The Algorithmic Foundations of Differential Privacy[J]. Foundations and Trends in Theoretical Computer Science, 2013(9): 211-407. |
[1] | 温金明, 刘庆, 陈洁, 吴永东. 基于错误学习的全同态加密技术研究现状与挑战[J]. 信息网络安全, 2024, 24(9): 1328-1351. |
[2] | 林湛航, 向广利, 李祯鹏, 徐子怡. 基于同态加密的前馈神经网络隐私保护方案[J]. 信息网络安全, 2024, 24(9): 1375-1385. |
[3] | 郭倩, 赵津, 过弋. 基于分层聚类的个性化联邦学习隐私保护框架[J]. 信息网络安全, 2024, 24(8): 1196-1209. |
[4] | 李增鹏, 王思旸, 王梅. 隐私保护近邻检测研究[J]. 信息网络安全, 2024, 24(6): 817-830. |
[5] | 傅彦铭, 陆盛林, 陈嘉元, 覃华. 基于深度强化学习和隐私保护的群智感知动态任务分配策略[J]. 信息网络安全, 2024, 24(3): 449-461. |
[6] | 宋玉涵, 祝跃飞, 魏福山. 一种基于AdaBoost模型的区块链异常交易检测方案[J]. 信息网络安全, 2024, 24(1): 24-35. |
[7] | 许可, 李嘉怡, 蒋兴浩, 孙锬锋. 一种基于轮廓稀疏对抗的视频步态隐私保护算法[J]. 信息网络安全, 2024, 24(1): 48-59. |
[8] | 徐茹枝, 戴理朋, 夏迪娅, 杨鑫. 基于联邦学习的中心化差分隐私保护算法研究[J]. 信息网络安全, 2024, 24(1): 69-79. |
[9] | 赖成喆, 赵益宁, 郑东. 基于同态加密的隐私保护与可验证联邦学习方案[J]. 信息网络安全, 2024, 24(1): 93-105. |
[10] | 俞惠芳, 乔一凡, 孟茹. 面向区块链金融的抗量子属性基门限环签密方案[J]. 信息网络安全, 2023, 23(7): 44-52. |
[11] | 唐雨, 张驰. 一种基于Intel SGX的信息中心网络隐私保护方案[J]. 信息网络安全, 2023, 23(6): 55-65. |
[12] | 杜卫东, 李敏, 韩益亮, 王绪安. 基于密文转换的高效通用同态加密框架[J]. 信息网络安全, 2023, 23(4): 51-60. |
[13] | 尹曙, 陈兴蜀, 朱毅, 曾雪梅. 基于字符空间构造的域名匿名化算法[J]. 信息网络安全, 2023, 23(4): 80-89. |
[14] | 郭瑞, 魏鑫, 陈丽. 工业物联网环境下可外包的策略隐藏属性基加密方案[J]. 信息网络安全, 2023, 23(3): 1-12. |
[15] | 李晓华, 王苏杭, 李凯, 徐剑. 一种支持隐私保护的传染病人际传播分析模型[J]. 信息网络安全, 2023, 23(3): 35-44. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||