学位论文 > 优秀研究生学位论文题录展示
基于动态数据的隐私保护技术研究
作 者: 李婵
导 师: 白似雪
学 校: 南昌大学
专 业: 计算机应用技术
关键词: 隐私保护 数据挖掘 多敏感属性 动态重发布
分类号: TP393.08
类 型: 硕士论文
年 份: 2010年
下 载: 95次
引 用: 0次
阅 读: 论文下载
内容摘要
随着信息化的高速发展,因特网上的信息变得越来越杂乱无章,人们从因特网获得需要的信息变得越来越难,这是因为因特网在给人们提供有用信息的同时还会给人们提供一大堆冗余信息。因此,如今,从海量信息中获取对自己有利的信息对人们的工作日益重要,为此,专家学者开辟了数据挖掘研究领域,目的就是研究如何利用计算机高效地完成对信息的搜索以得到人们想要的信息。目前,数据挖掘已经体现出了它的价值,各类搜索引擎的出现,各种信息挖掘技术为人们解决了很多问题。但是,随着数据挖掘的应用,有个现状日益引起人们的重视,即隐私泄露问题。目前已有文献针对静态数据集和动态数据集的隐私保护问题进行了研究。本文在指出已有文献算法的不足基础上,对还未解决的问题提出解决办法。本文的主要研究工作如下:1)为多敏感属性数据集提出隐私保护算法。已有的文献虽然针对了静态和动态两类数据集,但是它们都是假设这两类数据集只有一个敏感属性,而我们现实生活中,一个数据集往往会有多个敏感属性,本文在分析了多敏感属性数据集的特征后,设计了多维数组分组技术,同时在这个技术基础上提出了三种贪心分组策略来对多敏感属性数据集进行隐私处理。最后,实验通过改变三个参数,即数据集大小、1参数和敏感属性个数,来观察三种算法的运行效率。2)为多敏感属性数据集重发布问题提出解决办法。已有文献对动态数据集的重发布进行了研究,但是都是基于单敏感属性数据集,本文借鉴了它们的算法思想,将它们改进后应用于多敏感属性数据集的数据重发布问题中,结合前面已讨论的多敏感属性数据集的隐私保护算法,提出一个适用于多敏感属性数据集重发布问题的隐私保护算法。本文在提出解决办法的同时,还给出了隐私风险披露的估算方法,提出了SCG图概念,为后面算法的理解提供工具。最后,本文对每个算法进行了实验,验证了本文提出的算法是可行的。
|
全文目录
摘要 3-4 ABSTRACT 4-8 第1章 绪论 8-14 1.1 研究背景 8-9 1.2 研究意义 9-10 1.3 隐私保护算法 10-11 1.4 国内外研究现状 11-13 1.4.1 国外的研究现状 11-12 1.4.2 国内的研究现状 12-13 1.5 本文的组织结构 13-14 第2章 相关隐私保护技术 14-27 2.1 隐私的概念 14-15 2.1.1 隐私及其度量 14 2.1.2 隐私的数学定义 14-15 2.2 隐私泄露风险评估 15-19 2.2.1 SCG图 16-18 2.2.2 隐私揭露风险 18-19 2.3 静态隐私保护算法 19-23 2.3.1 k-anonymity 19-20 2.3.2 l-diversity 20-21 2.3.3 t-closeness 21-22 2.3.4 εinclusion 22-23 2.4 动态隐私保护算法 23-26 2.4.1 Security anonymization 23-24 2.4.2 m-invariance 24-25 2.4.3 m-invariance extention 25-26 2.5 小结 26-27 第3章 多敏感属性数据集隐私保护算法 27-43 3.1 数学表示形式 27-30 3.1.1 问题提出 27-28 3.1.2 数学形式定义 28-30 3.2 算法提出 30-37 3.2.1 多维数组分组技术 30-31 3.2.2 MSBF算法 31-33 3.2.3 MCF算法 33-37 3.2.4 WMCF算法 37 3.3 实验结果 37-42 3.3.1 不同算法的信息丢失率对比 38-40 3.3.2 不同算法的执行时间对比 40-42 3.4 小结 42-43 第4章 多敏感属性数据集的数据重发布问题 43-55 4.1 数据重发布中的隐私问题 43-46 4.1.1 支持插入操作的数据重发布算法 45 4.1.2 m-invariance算法 45-46 4.2 θ-inclusion规则 46-54 4.2.1 数学表示 46-50 4.2.2 算法实现 50-52 4.2.3 实验 52-54 4.3 小结 54-55 第5章 总结与展望 55-57 5.1 本文工作总结 55 5.2 未来展望 55-57 致谢 57-58 参考文献 58-62 攻读学位期间的研究成果 62
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
- 基于数据挖掘的信用卡客户激活与响应度研究,F832.2
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络安全
© 2012 www.xueweilunwen.com
|