学位论文 > 优秀研究生学位论文题录展示

支持隐私保护的数据挖掘研究

作 者: 俞笛
导 师: 徐向阳
学 校: 湖南大学
专 业: 计算机应用技术
关键词: 隐私保护 分类挖掘 聚类挖掘 同态加密 保序加密
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 314次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着信息技术的飞速发展,网络中的数据共享和交换行为出现得越来越频繁。由于数据挖掘能从信息数据中提取有用的信息,因此它被作为分析工具而得到了广泛应用。而同时数据挖掘带来的隐私问题已经引起了人们的关注。本文主要研究分布式下的隐私保护数据挖掘算法。论文的主要工作如下:第一,对隐私保护数据挖掘算法进行了概括。然后,定义了数据挖掘中隐私的基本概念,并指出了隐私保护机制的目标。第二,本文结合数据分布方式、数据修改方式和隐私保护技术等角度,对当前典型的隐私保护数据挖掘算法作了一个全面的分析和介绍。第三,本文在相关研究的基础上,将同态加密和保序加密相结合,提出了一种新的支持隐私保护的分类算法。本算法在保证挖掘结果的前提下,解决了密文的数学运算和数值比较问题,满足的挖掘的隐私保护需求,并且降低了算法的通信和计算复杂度。实验结果表明:相对于同类算法,本算法是一种通信复杂度为线性级的高效解决方案,在计算效率方面也有了较大的提高。第四,通过改变数据垂直分布条件下聚类步骤,提出了一种基于加密技术的聚类方法。本文将该方法应用到了k-中心聚类算法当中,实现了保护数据隐私安全的同时,能进行有效的聚类挖掘。实验结果表明:本文算法在计算开销和通信开销之间可以达到一个较好的平衡,与同类算法相比,该算法具有运行效率高、计算和通信开销较小的特点,并且通过隐藏明文的分布,使所有的站点都可以得到有力的保护,解决了站点子集隐私泄漏的问题。

全文目录


摘要  5-6
ABSTRACT  6-13
第1章 绪论  13-15
  1.1 研究背景及意义  13-14
  1.2 研究内容与章节安排  14-15
第2章 隐私保护挖掘算法综述  15-31
  2.1 数据挖掘基本介绍  15-18
  2.2 隐私的概念  18-19
  2.3 隐私保护的分类  19-20
  2.4 集中式隐私保护挖掘  20-22
  2.5 分布式隐私保护挖掘  22-29
    2.5.1 水平分布下的隐私保护挖掘  22-26
    2.5.2 垂直分布下的隐私保护挖掘  26-29
  2.6 隐私保护技术评价  29-30
  2.7 小结  30-31
第3章 支持隐私保护的分类算法研究  31-44
  3.1 问题描述  31
  3.2 基本概念  31-35
    3.2.1 k 最近邻分类  31-32
    3.2.2 秘密同态  32-34
    3.2.3 保序加密算法  34-35
  3.3 隐私定义  35-36
  3.4 相关研究  36-37
  3.5 基于加密技术的隐私保护分类挖掘算法  37-38
    3.5.1 问题分析  37
    3.5.2 基于加密技术的分类挖掘算法  37-38
  3.6 算法分析  38-40
    3.6.1 正确性分析  38-39
    3.6.2 隐私保护分析  39
    3.6.3 通信复杂度分析  39
    3.6.4 计算复杂度分析  39-40
  3.7 实验  40-43
    3.7.1 实验方法及环境  40
    3.7.2 实验结果及分析  40-43
  3.8 小结  43-44
第4章 支持隐私保护的聚类算法研究  44-59
  4.1 问题描述  44
  4.2 相关研究  44-45
  4.3 基本概念  45
  4.4 隐私定义  45-46
  4.5 基于加密技术的隐私保护聚类挖掘算法  46-49
    4.5.1 隐私保护k-中心算法  46-47
    4.5.2 隐私保护k-中心聚类划分  47-49
  4.6 隐私分析  49-50
    4.6.1 正确性分析  49-50
    4.6.2 隐私保护分析  50
  4.7 效率分析  50-51
    4.7.1 通信复杂度分析  50-51
    4.7.2 计算复杂度分析  51
  4.8 实验  51-57
    4.8.1 实验方法及环境  51-52
    4.8.2 实验结果及分析  52-57
  4.9 小结  57-59
结论  59-61
参考文献  61-65
致谢  65-66
附录 A 攻读硕士学位期间所发表的学术论文目录  66-67
附录 B 攻读硕士学位期间参与的科研活动  67

相似论文

  1. 云计算数据隐私保护方法的研究,TP393.08
  2. GSM-R网络干扰分析和优化策略研究,TN929.532
  3. 一种智能手机上基于位置的多媒体信息分享系统,TP37
  4. 面向隐私保护的关联规则挖掘研究,TP311.13
  5. 遗传算法在数据挖掘聚类分析中的应用研究,TP311.13
  6. 私有信息检索及其应用的研究,TN918.1
  7. 基于正交变换和安全点积的隐私保护支持向量机研究,TP18
  8. 隐私保护支持向量机的算法研究,TP309
  9. 无线传感器网络安全的数据融合协议,TN915.04
  10. 基于聚类挖掘的视频摘要生成研究,TP391.41
  11. WebGIS中PKI体系的应用研究,TP393.09
  12. GML时空聚类挖掘研究,P208
  13. 社区化网络中的隐私保护,O157.5
  14. 异构数据源集成及聚类挖掘的研究与应用,TP311.13
  15. 序列模式挖掘研究,TP311.13
  16. 数据挖掘技术在个性化信息检索系统中的应用研究,G354
  17. 基于元搜索与内容聚类的情报获取技术研究,G354
  18. 电子投票协议的研究,TP393.09
  19. 隐私保持协同过滤推荐算法研究,TP301.6
  20. K-匿名隐私保护问题的研究,TP309

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com