学位论文 > 优秀研究生学位论文题录展示

分布式数据库下数据水平分布的skyline计算研究

作 者: 严伟榆
导 师: 周丽华
学 校: 云南大学
专 业: 计算机软件与理论
关键词: skyline计算 分布式数据库 区域划分 多窗口收集
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 62次
引 用: 0次
阅 读: 论文下载
 

内容摘要


Skyline计算就是从一个数据集中找到不被其他数据点支配的所有点的集合。如果一个数据a支配另一个数据b,那么a的每一维属性值都不比b对应属性值“差”,而且必须至少有一个属性值比b的“好”。“差”和“好”无统一定义,可以根据用户的选择和喜好定义。近年来,skyline计算逐渐成为数据库领域的一个研究热点,主要是因为它在多标准决策、数据挖掘和数据库可视化等领域有潜在的应用前景。对于集中式数据库下的skyline计算的研究已经比较成熟,分布式数据库下的skyline计算由于起步较晚,现有的研究成果仍不够成熟。本论文主要研究的是分布式数据库下数据呈水平分布时的skyline计算的问题。数据的水平分布指的是数据集合分散的存放在不同的服务器上。论文的主要工作包括以下几个方面:(1)研究各个服务器上的局部skyline集合与全局skyline集合之间的关系,提出通过汇总局部结果再次计算得到全局skyline集合的思想。(2)为了提高计算效率,提出了一种“区域划分和多窗口收集”的优化策略。论文深入讨论了区域划分的思想及不同服务器上划分区域之间的支配关系,给出了三维数据空间下的基于“区域划分和多窗口收集”的skyline计算算法。(3)进一步讨论了对高维数据空间下进行区域划分可能出现的一些问题,提出只对数据的前三维进行区域划分的不完全划分思想和skyline计算的解决方案。(4)进行了大量的实验,通过实验结果分析得出论文提出的“区域划分和多窗口收集”策略对提高分布式数据库上的skyline计算效率有一定的效果。

全文目录


摘要  3-4
Abstract  4-7
第1章 绪论  7-11
  1.1 研究背景  7-9
  1.2 主要研究工作  9
  1.3 论文组织  9-11
第2章 skyline计算及经典算法介绍  11-22
  2.1 引言  11
  2.2 skyline定义及其性质  11-12
  2.3 集中式环境下的skyline计算  12-17
    2.3.1 BNL算法  12-13
    2.3.2 D&C(divide-and-conquer algorithm)算法  13-14
    2.3.3 NN(near neighbor algorithm)算法  14-16
    2.3.4 BBS(branch-and-bound skyline algorithm)算法  16-17
    2.3.5 算法的性能比较  17
  2.4 分布式skyline计算  17-20
    2.4.1 垂直划分的分布式数据库  17-19
    2.4.2 移动自组织网络  19
    2.4.3 对等网络  19-20
  2.5 其他skyline计算  20-21
  2.6 小结  21-22
第3章 分布式数据库下水平分布数据的skyline计算  22-30
  3.1 引言  22
  3.2 分布式数据库下水平分布数据的 skyline 计算  22-28
    3.2.1 区域划分思想  23-26
    3.2.2 一种分布式数据库下数据水平分布的skyline计算算法  26-28
  3.3 高维空间的skyline计算  28-29
  3.4 小结  29-30
第4章 实验与分析  30-38
  4.1 引言  30
  4.2 实验环境配置与部署  30
  4.3 测试数据集  30-32
  4.4 实验结果与分析  32-38
    4.4.1 PC算法的正确性分析  32-33
    4.4.2 PC算法的有效性分析  33-38
第5章 结束语  38-39
参考文献  39-41
附录 攻读硕士学位期间完成的论文和研究课题  41-42
致谢  42

相似论文

  1. 家庭清扫机器人路径覆盖系统的设计与实现,TP242
  2. 曲靖烟区气候因素的数量特征及区域划分,S572
  3. 基于Oracle的移动彩铃分布式数据库设计与实现,TP311.13
  4. 网络备份系统中管理控制的设计与实现,TP309.3
  5. 基于Shared Nothing机制的分布式数据访问层研究,TP311.13
  6. 基于区域划分的Ad Hoc网络多径路由协议研究,TN929.5
  7. 大安山煤矿冲击危险性区划及专家系统的研究,TD324
  8. 黄岛开发区中水回用方案设计及规划研究,TU991.57
  9. 水库决策支持系统的研究与开发,TP311.52
  10. 基于图像区域划分的灰度图像彩色处理技术的研究,TP391.41
  11. 基于WCF services的团队群组消息沟通平台开发,TP311.52
  12. 机动车驾驶员无纸化考试管理系统的设计与实现,TP311.52
  13. 税务系统分布式数据库安全策略的研究与实现,TP311.13
  14. 分布式数据库在物流仓储管理系统中的应用,TP311.13
  15. 基于网络路由行为的铁路春运方案及可靠度研究,U293.1
  16. 基于DCS存储策略的WSN数据查询的研究与实现,TN929.5
  17. WSN中基于拓扑控制的AHM-GAF算法研究,TN929.5
  18. 分布式数据库查询优化算法的研究,TP311.13
  19. 基于高级SQL查询的分布式多维关联规则挖掘算法的研究,TP311.13
  20. 基于JMS的分布式事务处理系统的研究与实现,TP311.13
  21. 银行业务监管系统的数据库建设,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com