学位论文 > 优秀研究生学位论文题录展示

针对K-匿名隐私数据的判定树和关联规则算法的研究

作 者: 林丙春
导 师: 刘国华
学 校: 东华大学
专 业: 计算机应用技术
关键词: k-匿名 判定树 关联规则 数据挖掘
分类号: TP311.13
类 型: 硕士论文
年 份: 2012年
下 载: 59次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据可用性问题是k-匿名隐私保护模型带来的一个具有挑战性问题。1998年L.sweedy提出了保护用户隐私的k-匿名隐私保护模型,泛化准标识符,虽然保护了用户的隐私但是大大降低了数据的可用性,之后为了在保护隐私的同时提高数据的可用性,研究人员对k-匿名隐私保护模型进行了改进,但是受隐私保护要求的制约,即使最优化的k-匿名算法,也不可能产生完全精确的数据,因此,改进k-匿名算法只能在一定程度上提高数据的可用性,不可能彻底解决问题。数据挖掘问题是提高k-匿名隐私保护模型下数据可用性问题之一。通过分析发现生成k-匿名表时所利用的泛化树同利用精确表生成的判定树的部分非叶结点的属性值的概化过程有相同之处。由此文中提出了一种基于k-匿名表的判定树生成算法,该算法直接以k匿名表作为输入,避免了经典的判定树算法运行前的准备工作,该算法比经典的判定树算法在时间上有明显地改善。判定树算法是重要的分类和预测的数据挖掘算法。文中提到了四种匿名化分类情况,分别为:(1)利用匿名化数据建立模型,来分类匿名化数据。(2)利用匿名化数据建立数据模型,分类原始数据。(3)利用精确数据建立模型,来分类匿名化数据。(4)利用匿名化数据分类分布式数据。改进的判定树算法是利用匿名化数据作为输入的,即利用匿名化数据建立的模型。所以文中对前两中分类情况做了详细的论述。关联规则的发现是数据挖掘中重要的研究分支,是发现大量数据中项集之间有趣的关联或相关联系。在关联规则挖掘算法中,根据规则集所涉及的抽象层可将规则分为多层关联规则和单层关联规则。所谓多层关联规则即规则中的项为精确表中项的泛化,且在很多应用中在底层或原始抽象级别上很难发现数据项间的强关联规则,一般情况下都需要挖掘多层关联规则。从这层意义上来说,多层关联规则的挖掘同k-匿名泛化过程是有共同点的。同时由于k-匿名数据是一种特殊的不确定数据,文中对经典的Apriori算法进行改进,使其适合k-匿名隐私保护模型。实验结果表明,文中提出的算法行之有效。

全文目录


相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  3. 基于遗传算法和粗糙集的聚类算法研究,TP18
  4. 基于数据挖掘的税务稽查选案研究,F812.42
  5. 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
  6. 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
  7. 关联规则挖掘在交通事故成因分析中的应用,U491.31
  8. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  9. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  10. 关联规则挖掘算法及其在职校教学评价系统中的应用研究,TP311.13
  11. FP-Tree算法在自适应学习系统学习者特征模型建立中的应用研究,TP311.13
  12. 数据挖掘在电大开放教育学习指导体系中的应用研究,TP311.13
  13. 基于数据挖掘技术的高校毕业生就业管理信息系统的设计与实现,TP311.52
  14. 面向专科院校的图书管理与智能分析系统,TP311.13
  15. 基于量子理论的聚类算法研究,TP311.13
  16. 社交网络中个人信息与人际关系的隐私保护研究,TP393.08
  17. 基于改良蚁群算法的神经网络分类规则提取,TP183
  18. 选矿过程综合生产指标分解的补偿方法及应用,TP311.13
  19. 基于关联规则的结构化浏览技术及其应用,TP391.41
  20. 基于FP-Growth关联规则的并行算法分析及其应用研究,TP311.13
  21. 一种基于关联规则的隐私保护算法研究,TP309

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com