学位论文 > 优秀研究生学位论文题录展示
支持隐私保护的数据挖掘研究
作 者: 俞笛
导 师: 徐向阳
学 校: 湖南大学
专 业: 计算机应用技术
关键词: 隐私保护 分类挖掘 聚类挖掘 同态加密 保序加密
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 314次
引 用: 1次
阅 读: 论文下载
内容摘要
随着信息技术的飞速发展,网络中的数据共享和交换行为出现得越来越频繁。由于数据挖掘能从信息数据中提取有用的信息,因此它被作为分析工具而得到了广泛应用。而同时数据挖掘带来的隐私问题已经引起了人们的关注。本文主要研究分布式下的隐私保护数据挖掘算法。论文的主要工作如下:第一,对隐私保护数据挖掘算法进行了概括。然后,定义了数据挖掘中隐私的基本概念,并指出了隐私保护机制的目标。第二,本文结合数据分布方式、数据修改方式和隐私保护技术等角度,对当前典型的隐私保护数据挖掘算法作了一个全面的分析和介绍。第三,本文在相关研究的基础上,将同态加密和保序加密相结合,提出了一种新的支持隐私保护的分类算法。本算法在保证挖掘结果的前提下,解决了密文的数学运算和数值比较问题,满足的挖掘的隐私保护需求,并且降低了算法的通信和计算复杂度。实验结果表明:相对于同类算法,本算法是一种通信复杂度为线性级的高效解决方案,在计算效率方面也有了较大的提高。第四,通过改变数据垂直分布条件下聚类步骤,提出了一种基于加密技术的聚类方法。本文将该方法应用到了k-中心聚类算法当中,实现了保护数据隐私安全的同时,能进行有效的聚类挖掘。实验结果表明:本文算法在计算开销和通信开销之间可以达到一个较好的平衡,与同类算法相比,该算法具有运行效率高、计算和通信开销较小的特点,并且通过隐藏明文的分布,使所有的站点都可以得到有力的保护,解决了站点子集隐私泄漏的问题。
|
全文目录
摘要 5-6 ABSTRACT 6-13 第1章 绪论 13-15 1.1 研究背景及意义 13-14 1.2 研究内容与章节安排 14-15 第2章 隐私保护挖掘算法综述 15-31 2.1 数据挖掘基本介绍 15-18 2.2 隐私的概念 18-19 2.3 隐私保护的分类 19-20 2.4 集中式隐私保护挖掘 20-22 2.5 分布式隐私保护挖掘 22-29 2.5.1 水平分布下的隐私保护挖掘 22-26 2.5.2 垂直分布下的隐私保护挖掘 26-29 2.6 隐私保护技术评价 29-30 2.7 小结 30-31 第3章 支持隐私保护的分类算法研究 31-44 3.1 问题描述 31 3.2 基本概念 31-35 3.2.1 k 最近邻分类 31-32 3.2.2 秘密同态 32-34 3.2.3 保序加密算法 34-35 3.3 隐私定义 35-36 3.4 相关研究 36-37 3.5 基于加密技术的隐私保护分类挖掘算法 37-38 3.5.1 问题分析 37 3.5.2 基于加密技术的分类挖掘算法 37-38 3.6 算法分析 38-40 3.6.1 正确性分析 38-39 3.6.2 隐私保护分析 39 3.6.3 通信复杂度分析 39 3.6.4 计算复杂度分析 39-40 3.7 实验 40-43 3.7.1 实验方法及环境 40 3.7.2 实验结果及分析 40-43 3.8 小结 43-44 第4章 支持隐私保护的聚类算法研究 44-59 4.1 问题描述 44 4.2 相关研究 44-45 4.3 基本概念 45 4.4 隐私定义 45-46 4.5 基于加密技术的隐私保护聚类挖掘算法 46-49 4.5.1 隐私保护k-中心算法 46-47 4.5.2 隐私保护k-中心聚类划分 47-49 4.6 隐私分析 49-50 4.6.1 正确性分析 49-50 4.6.2 隐私保护分析 50 4.7 效率分析 50-51 4.7.1 通信复杂度分析 50-51 4.7.2 计算复杂度分析 51 4.8 实验 51-57 4.8.1 实验方法及环境 51-52 4.8.2 实验结果及分析 52-57 4.9 小结 57-59 结论 59-61 参考文献 61-65 致谢 65-66 附录 A 攻读硕士学位期间所发表的学术论文目录 66-67 附录 B 攻读硕士学位期间参与的科研活动 67
|
相似论文
- 云计算数据隐私保护方法的研究,TP393.08
- GSM-R网络干扰分析和优化策略研究,TN929.532
- 一种智能手机上基于位置的多媒体信息分享系统,TP37
- 面向隐私保护的关联规则挖掘研究,TP311.13
- 遗传算法在数据挖掘聚类分析中的应用研究,TP311.13
- 私有信息检索及其应用的研究,TN918.1
- 基于正交变换和安全点积的隐私保护支持向量机研究,TP18
- 隐私保护支持向量机的算法研究,TP309
- 无线传感器网络安全的数据融合协议,TN915.04
- 基于聚类挖掘的视频摘要生成研究,TP391.41
- WebGIS中PKI体系的应用研究,TP393.09
- GML时空聚类挖掘研究,P208
- 社区化网络中的隐私保护,O157.5
- 异构数据源集成及聚类挖掘的研究与应用,TP311.13
- 序列模式挖掘研究,TP311.13
- 数据挖掘技术在个性化信息检索系统中的应用研究,G354
- 基于元搜索与内容聚类的情报获取技术研究,G354
- 电子投票协议的研究,TP393.09
- 隐私保持协同过滤推荐算法研究,TP301.6
- K-匿名隐私保护问题的研究,TP309
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|