学位论文 > 优秀研究生学位论文题录展示
基于隐私保护的分布式聚类算法的研究
作 者: 何青松
导 师: 吴承荣
学 校: 复旦大学
专 业: 计算机应用技术
关键词: 隐私保护 分布式 数据挖掘 微簇 安全计算
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 125次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘技术正受到人们越来越多的关注,与此同时隐私保护问题也日益受到广大人们的重视。如何在保护自身隐私的同时进行充分的合作和数据的共享,已经成为人工智能领域的一个研究热点。本文主要针对多方合作计算问题展开了研究,目的在于使参与各方能在很好的保护自身敏感数据及数据分布情况等知识的前提下,能很好的进行相互间的协作,挖掘出基于整体数据集的知识作为参与者的共同财产。通过将数据流当中的微簇概念引入到分布式的环境中,并加入多方安全协议,我们提出了基于隐私保护的分布式聚类算法。该算法具有很小的通信消耗,较低的计算时间复杂度,然而却具有很好的安全性以及较高的准确率。考虑到信息飞速增长,各个行业内部合作逐步扩大的现实背景,文章在之前提出的基于微簇的聚类算法基础上进行了扩展,提出了增量式的隐私保护聚类算法IDPPKMeans (Increment Distributing Privacy Protect K-Means),避免了由于新的数据集加入到合作系统中而引起所有数据进行重新聚类的问题。最后通过实验证明该算法具有较高的准确度,并能很好的保护数据的安全性。
|
全文目录
摘要 5-6 ABSTRACT 6-7 第一章 引言 7-13 1.1 研究背景 7-8 1.2 国内外研究近况 8-11 1.3 本文的工作 11-13 第二章 聚类算法及隐私保护概述 13-25 2.1 数据挖掘概述 13 2.2 常见数据挖掘技术 13-16 2.3 聚类算法概述 16-19 2.3.1 基于距离的聚类算法 16-17 2.3.2 基于密度的聚类算法 17-18 2.3.3 分布式的聚类算法 18-19 2.4 隐私保护 19-23 2.4.1 隐私保护的定义 19-20 2.4.2 隐私保护与数据挖掘 20-23 2.5 隐私保护数据挖掘算法的评价标准 23-24 2.6 本章小结 24-25 第三章 基于微簇的隐私保护聚类算法 25-44 3.1 安全模型及算法相关定义 25-28 3.1.1 安全模型的定义 25-27 3.1.2 算法相关定义 27-28 3.2 基于可信任第三方的微簇分布式聚类算法 28-33 3.2.1 系统的框架 28-29 3.2.2 算法过程 29-32 3.2.3 算法参数分析 32-33 3.3 算法复杂度及安全性分析 33-37 3.3.1 算法复杂度分析 34-36 3.3.2 安全性分析 36-37 3.4 实验结果及分析 37-38 3.5 基于半可信任第三方的微簇聚类算法 38-43 3.5.1 算法描述 39-40 3.5.2 算法复杂度及安全性分析 40-42 3.5.3 实验及分析 42-43 3.6 小结 43-44 第四章 增量式环境下的分布式隐私保护聚类算法 44-56 4.1 问题描述 44 4.2 相关定义 44-46 4.3 算法思想 46-51 4.4 算法实现 51-52 4.5 实验结果与分析 52-55 4.5.1 准确度分析 53 4.5.2 时间复杂度分析 53-54 4.5.3 安全性分析 54-55 4.6 本章小结 55-56 第五章 结束语 56-57 参考文献 57-61 致谢 61-62 攻读硕士期间发表的论文 62-63
|
相似论文
- Ad-Hoc网络多信道MAC层协议的信道分配问题的研究,TN929.5
- 分布式系统的故障注入方法研究,TP338.8
- 并行分布式网络模拟器PDNS容错技术的研究,TP302.8
- 面向海量邮件的检索系统研究与实现,TP393.098
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 含分布式电源的微电网控制策略研究,TM61
- 基于移动Agent的分布式网络通信机制的研究,TP393.02
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 基于分布式环境压力测试问题的研究,TP311.52
- 一种可视化的分布式数据集成模型的研究与实现,TP311.52
- 分布式事务处理协议的研究与应用,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|