信息网络安全 ›› 2020, Vol. 20 ›› Issue (11): 75-86.doi: 10.3969/j.issn.1671-1122.2020.11.010
收稿日期:
2020-08-02
出版日期:
2020-11-10
发布日期:
2020-12-31
通讯作者:
罗海宁
E-mail:lhn@sic.gov.cn
作者简介:
肖彪(1983—),男,湖南,高级工程师,硕士,主要研究方向为网络安全监测、数据安全和大数据追踪溯源|闫宏强(1972—),男,河北,高级工程师,博士,主要研究方向为个人信息与隐私保护|罗海宁(1980—),男,江苏,高级工程师,硕士,主要研究方向为网络信息安全与数据安全|李炬成(1994—),男,山西,硕士研究生,主要研究方向为运筹优化与大数据挖掘
基金资助:
XIAO Biao1, YAN Hongqiang2,3, LUO Haining4(), LI Jucheng5
Received:
2020-08-02
Online:
2020-11-10
Published:
2020-12-31
Contact:
LUO Haining
E-mail:lhn@sic.gov.cn
摘要:
针对数据企业对用户信息以及开放数据趋势下政府数据发布工作对脱敏保护算法的迫切需求,文章提出一种基于差分隐私保护理论的具有属性段首选机制和基于聚类算法的贝叶斯网络改进型算法FCPrivBayes。该算法避免了对首个属性段属性的随机化选择,并用聚类的方法取代等宽法对数据进行离散化处理。实验数据表明,在保障数据隐私的前提下,FCPrivBayes有效提升了数据的可用性指标,为企业保护数据、政府发布数据提供了新的技术方案,有利于用户隐私保护工作的推进和大数据产业的发展。
中图分类号:
肖彪, 闫宏强, 罗海宁, 李炬成. 基于差分隐私的贝叶斯网络隐私保护算法的改进研究[J]. 信息网络安全, 2020, 20(11): 75-86.
XIAO Biao, YAN Hongqiang, LUO Haining, LI Jucheng. Research on Improvement of Bayesian Network Privacy Protection Algorithm Based on Differential Privacy[J]. Netinfo Security, 2020, 20(11): 75-86.
[1] | ZHANG Xiaojian, MENG Xiaofeng. Differential Privacy in Data Publication and Analysis[J]. Chinese Journal of Computers, 2014,37(4):927-949. |
张啸剑, 孟小峰. 面向数据发布和分析的差分隐私保护[J]. 计算机学报, 2014,37(4):927-949. | |
[2] |
LI Haoran, XIONG Li, ZHANG Lifan, el al. DPSynthesizer: Differentially Private Data Synthesizer for Privacy Preserving Data Sharing[J]. Proceedings of the VLDB Endowment, 2014,7(13):1677-1680.
doi: 10.14778/2733004.2733059 URL pmid: 26167358 |
[3] | OUYANG Jia, YIN Jian, LIU Shaopeng. Differential Privacy Publishing Strategy for Distributed Transaction Data[J]. Journal of Software, 2015,26(6):1457-1472. |
欧阳佳, 印鉴, 刘少鹏. 一种分布式事务数据的差分隐私发布策略[J]. 软件学报, 2015,26(6):1457-1472. | |
[4] | ZHANG Lin, LIU Yan, WANG Ruchuan. Location Publishing Technology Based on Differential Privacy-preserving for Big Data Services[J]. Journal on Communications, 2016,37(9):46-54. |
张琳, 刘彦, 王汝传. 位置大数据服务中基于差分隐私的数据发布技术[J]. 通信学报, 2016,37(9):46-54. | |
[5] | HARICHANDAN R, MURAT K, LATANYA S. Practical Differentially Private Modeling of Human Movement Data[EB/OL]. http://link.springer.com/chapter/10.1007/978-3-319-41483-6_13, 2020-7-16. |
[6] | XIAO Xiaokui, WANG Guozhang, GEHRKE Johannes. Differential Privacy via Wavelet Transforms[J]. IEEE Transactions on Knowledge & Data Engineering, 2011,23(8):1200-1214. |
[7] | XIAO Xiaokui, WANG Guozhang, GEHRKE , et al. Differential Privacy via Wavelet Transforms[J]. IEEE Transactions on Knowledge & Data Engineering, 2011,23(8):1200-1214. |
[8] | ZHANG Jun, GRAHAM C, CECILIA M, et al. PrivBayes: Private Data Release via Bayesian Networks[EB/OL]. https://www.researchgate.net/publication/320679178_PrivBayes_Private_Data_Release_via_Bayesian_Networks, 2020-7-16. |
[9] | LI Mingzhu. Privacy Data Publishing Method Based on Smoothness Sensitivity in Bayesian Networks[D]. Inner Mongolia University, 2019. |
李明珠. 基于平滑敏感度的贝叶斯网络隐私数据发布方法[D]. 内蒙古大学, 2019. | |
[10] | HAO Zhifeng, WANG Riyu, CAI Ruichu, et al. Privacy Data Publishing Method Based on Bayesian Network and Semantic Tree[J]. Computer Engineering, 2019,45(4):124-129. |
郝志峰, 王日宇, 蔡瑞初, 温雯. 基于贝叶斯网络与语义树的隐私数据发布方法[J]. 计算机工程, 2019,45(4):124-129. | |
[11] | ZHANG Xiaojian, CHEN Li, JIN Kaizhong, et al. Private High-dimensional Data Publication with Junction Tree[J]. Journal of Computer Research and Development, 2018,55(12):2794-2809. |
张啸剑, 陈莉, 金凯忠, 等. 基于联合树的隐私高维数据发布方法[J]. 计算机研究与发展, 2018,55(12):2794-2809. | |
[12] | WANG Liang, WANG Weiping, MENG Dan. Privacy Preserving Data Publishing via Weighted Bayesian Networks[J]. Journal of Computer Research and Development, 2016,53(10):2343-2353. |
王良, 王伟平, 孟丹. 基于加权贝叶斯网络的隐私数据发布方法[J]. 计算机研究与发展, 2016,53(10):2343-2353.
doi: 10.7544/issn1000-1239.2016.20160465 URL |
|
[13] | MCSHERRY F. Privacy Integrated Queries: An Extensible Platform for Privacy-preserving Data Ana1ysis[EB/OL]. https://dl.acm.org/doi/pdf/10.1145/1559845.1559850, 2020-7-16. |
[14] | DWORK C, MCSHERRY F, NISSIM K, et al. Calibrating Noise to Sensitivity in Private Data Analysis[C]// Springer. Proceedings of the 3th Theory of Cryptography Conference (TCC), March 3-4, 2006, New York,USA. Heidelberg: Springer, 2006: 363-385. |
[15] | MCSHERRY F, TALWAR K. Mechanism Design via Differential Privacy[EB/OL]. https://www.researchgate.net/publication/4294387_Mechanism_Design_via_Differential_Privacy, 2020-7-16. |
[16] | BARAK , BOAZ C, DWORK K, et al. Privacy, Accuracy,Consistency too: A Holistic Solution to Contingency Table Release[EB/OL]. https://dblp.uni-trier.de/pid/83/6616.html, 2020-5-18. |
[17] | ZHOU Zhihua. Machine Learning[M]. Beijing: Tsinghua University Press, 2016. |
周志华. 机器学习[M]. 北京: 清华大学出版社, 2016. |
[1] | 汪金苗, 谢永恒, 王国威, 李易庭. 基于属性基加密的区块链隐私保护与访问控制方法[J]. 信息网络安全, 2020, 20(9): 47-51. |
[2] | 李宁波, 周昊楠, 车小亮, 杨晓元. 云环境下基于多密钥全同态加密的定向解密协议设计[J]. 信息网络安全, 2020, 20(6): 10-16. |
[3] | 张佳程, 彭佳, 王雷. 大数据环境下的本地差分隐私图信息收集方法[J]. 信息网络安全, 2020, 20(6): 44-56. |
[4] | 彭长根, 赵园园, 樊玫玫. 基于最大信息系数的主成分分析差分隐私数据发布算法[J]. 信息网络安全, 2020, 20(2): 37-48. |
[5] | 何泾沙, 杜晋晖, 朱娜斐. 基于k匿名的准标识符属性个性化实现算法研究[J]. 信息网络安全, 2020, 20(10): 19-26. |
[6] | 黄保华, 程琪, 袁鸿, 黄丕荣. 基于距离与误差平方和的差分隐私K-means聚类算法[J]. 信息网络安全, 2020, 20(10): 34-40. |
[7] | 唐春明, 林旭慧. 隐私保护集合交集计算协议[J]. 信息网络安全, 2020, 20(1): 9-15. |
[8] | 汪金苗, 王国威, 王梅, 朱瑞瑾. 面向雾计算的隐私保护与访问控制方法[J]. 信息网络安全, 2019, 19(9): 41-45. |
[9] | 郝文江, 林云. 互联网企业社会责任现状与启示研究[J]. 信息网络安全, 2019, 19(9): 130-133. |
[10] | 周权, 许舒美, 杨宁滨. 一种基于ABGS的智能电网隐私保护方案[J]. 信息网络安全, 2019, 19(7): 25-30. |
[11] | 李怡霖, 闫峥, 谢皓萌. 车载自组织网络的隐私保护综述[J]. 信息网络安全, 2019, 19(4): 63-72. |
[12] | 蒋辰, 杨庚, 白云璐, 马君梅. 面向隐私保护的频繁项集挖掘算法[J]. 信息网络安全, 2019, 19(4): 73-81. |
[13] | 傅彦铭, 李振铎. 基于拉普拉斯机制的差分隐私保护k-means++聚类算法研究[J]. 信息网络安全, 2019, 19(2): 43-52. |
[14] | 赵志岩, 吴剑, 康凯. 一种兼顾业务数据安全的隐私保护世系发布方法[J]. 信息网络安全, 2019, 19(12): 29-37. |
[15] | 胡荣磊, 何艳琼, 曾萍, 范晓红. 一种大数据环境下医疗隐私保护方案设计与实现[J]. 信息网络安全, 2018, 18(9): 48-54. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||