学位论文 > 优秀研究生学位论文题录展示

基于隐私保护聚类的分析和研究

作 者: 张怡菲
导 师: 傅彦
学 校: 电子科技大学
专 业: 计算机软件与理论
关键词: 隐私保护 安全多方计算 内积运算 谱聚类 谱图理论
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 92次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来随着计算机技术、存储技术和互联网络的迅速发展,各个行业已经积累了海量的数据。人们迫切的希望能从这些海量数据中发现有用的信息来指导相应的决策制定。数据挖掘技术作为一种强大的数据分析手段,可以从数据中提取潜在的知识(模型或规则)。但是传统的数据挖掘技术中,由于原始数据在挖掘时并没有进行任何的处理,导致在发现知识的同时,会不可避免的侵犯到隐私敏感数据,因此敏感数据的隐私保护问题得到越来越多的关注。目前已有很多工作研究如何在保护数据隐私的前提下提高数据挖掘结果的准确性。隐私保护的数据挖掘致力于提供可用有效的方法,这些方法可以计算出一个较好的数据挖掘算法的结果,又不暴露隐私信息(至少是一些敏感信息)。现存的隐私保护的数据挖掘涉及到的数据挖掘领域主要有关联规则、分类和聚类。已有的隐私保护的数据挖掘工作主要集中在关联规则和分类算法上,而隐私保护的聚类算法研究则相对较少。本文主要研究基于隐私保护的聚类方面的问题,主要内容如下:研究了针对数据水平分割的分布式系统下的隐私保护问题,并在此系统下设计了一种新的向量内积安全计算协议和矩阵乘积安全计算协议。通过结合多方安全计算协议和随机正交矩阵变换扰乱方法,提出了一种新的混合式隐私保护算法。理论分析和实验结果表明,该算法可以在保护数据隐私的同时,实现数据挖掘结果准确性的零丢失。针对数据集中分布的集中式系统下的隐私保护问题,提出了一种基于谱图理论的隐私保护聚类算法。对谱聚类的原理-谱图理论进行研究,将之推广到集中式数据分布环境中的数据发布问题上。由于在谱图理论中,数据的聚类问题可以转换为图的划分问题,并且通过图的谱即特征向量,给出图划分问题的近似最优解。所以,将原始数据进行预处理后,求解拉普拉斯矩阵的特征向量矩阵,并将之发布给第三方,由第三方进行聚类挖掘。通过试验证明,该算法可以在保护数据隐私的前提下,保证聚类效果的有效性。此外,为了有效解决谱聚类中规模参数的选择问题,我们提出了一种基于邻居排序的自适应谱聚类算法。这种算法可以自动的计算规模参数,并使点之间的相似度随着距离的增加下降的更快。

全文目录


相似论文

  1. 基于图分割的文本提取方法研究,TP391.41
  2. 云计算数据隐私保护方法的研究,TP393.08
  3. 智能卡数据库管理系统的研究与实现,TP311.52
  4. 基于个人感受的位置匿名隐私保护技术研究,TP309
  5. 基于视窗操作系统的程序隐藏技术术究,TP393.08
  6. 一种智能手机上基于位置的多媒体信息分享系统,TP37
  7. 面向隐私保护的关联规则挖掘研究,TP311.13
  8. 传感数据起源隐私保护技术的研究与应用,TP393.08
  9. 基于谱聚类的无监督图像分割,TP391.41
  10. 基于隐私保护的多步攻击关联方法研究,TP311.13
  11. 我国流行病学研究伦理问题、原则及对策探讨,R-052
  12. 基于无线网络的个性化位置隐私保护方案的研究与实现,TP309
  13. 基于物联网的RFID安全认证协议研究与设计,TN929.5
  14. 烟草样品中微量金属元素含量测定及模式识别研究,TS47
  15. 基于动态数据的隐私保护技术研究,TP393.08
  16. 跨系统个性化服务中隐私保持问题研究,TP393.08
  17. 保护隐私的分类挖掘技术研究,TP311.13
  18. 基于匿名模型的数据发布隐私保护技术研究,TP309.2
  19. 改进的谱聚类图像分割方法研究,TP391.41
  20. 动态数据集隐私保护技术研究,TP309.2
  21. 隐私保护分类数据挖掘研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com