学位论文 > 优秀研究生学位论文题录展示

大规模互联网地理标注快速聚类方法研究

作 者: 赵一
导 师: 刘纪平
学 校: 辽宁工程技术大学
专 业: 大地测量学与测量工程
关键词: 地理标注 海量数据 空间聚类 MongoDB 多级聚类单元
分类号: TP311.13
类 型: 硕士论文
年 份: 2012年
下 载: 32次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网技术的不断成熟和普及,互联网地理信息服务取得了飞速的发展,基于互联网电子地图的地理标注得到了广泛的应用,由于具有庞大的用户群,互联网地理标注具有数据量庞大,更新频繁的特点。面对海量的标注数据,人们通过其本身来获取信息、处理信息,但在大量数据的背后同样隐藏着潜在的知识和规律需要人们去发现、去挖掘,而人们所迫切需要掌握的则恰恰是这些知识和规律而非数据本身。空间聚类技术就是为了应对对空间数据的挖掘而产生的一种工具。随着3S技术的不断发展和成熟,大量具有复杂属性的空间数据被不断收集,互联网地理标注就是其中之一。通过运用空间聚类技术对大量的空间数据进行分析是一种极为有效的手段来发现海量数据背后所包含的知识和信息,对海量地理标注进行空间聚类能够有效发现空间对象的空间分布、聚集特征、空间发展趋势以及空间关联等,对社会经济等决策有着重要意义。本文针对互联网地理标注的高度异构性,设计了统一的管理及存储模型,同时顾及海量数据的高并发访问及快速存储与查询的需求,采用了非传统关系型的可扩展文档型数据库MongoDB来存储海量标注数据,同时通过对传统空间聚类方法处理海量数据能力的分析,采用了一种基于多级聚类单元的海量数据快速聚类方法,实现了将海量数据映射到多及聚类单元中,以聚类单元为运算单位进行聚类计算,从而极大的减少运算量,提高运算效率。

全文目录


致谢  5-6
摘要  6-7
Abstract  7-10
1 绪论  10-17
  1.1 研究背景  10-12
  1.2 国内外研究现状  12-14
  1.3 选题的研究意义及本文组织结构  14-17
    1.3.1 选题的理论意义及实用价值  14-15
    1.3.2 本文研究内容及组织结构  15-17
2 大规模数据的空间聚类技术分析  17-26
  2.1 经典空间聚类算法介绍  17-23
  2.2 空间聚类算法中的关键问题  23-24
  2.3 空间聚类对大规模数据处理能力现状分析  24-26
3 大规模地理标注存储模型研究  26-37
  3.1 基于 NoSQL 的数据存储技术  26-32
    3.1.1 传统数据库存储模式分析  26-28
    3.1.2 NoSQL 技术简介  28-29
    3.1.3 基于 NoSQL 的 MongoDB 数据库  29-30
    3.1.4 基于 MongoDB 的海量数据分片方法  30-32
  3.2 海量地理标注存储方法  32-37
    3.2.1 地理标注统一存储模型的设计  32-36
    3.2.2 空间索引的建立  36-37
4 海量数据的预处理与高效调度方法研究  37-41
  4.1 海量数据预处理方法  37-39
    4.1.1 多级聚类单元模型的建立  37-38
    4.1.2 海量地理标注的聚类单元映射  38-39
  4.2 基于约束条件的数据快速提取方法  39-41
5 基于多级聚类单元的大规模地理标注快速聚类实验  41-48
  5.1 试验环境与系统构架  41
  5.2 实验流程  41-43
  5.3 性能分析  43-48
    5.3.1 运行效率对比  43-45
    5.3.2 聚类结果精度对比  45-48
6 总结  48-50
  6.1 全文总结  48
  6.2 下一步工作展望  48-50
参考文献  50-52
作者简历  52-53
学位论文数据集  53-54

相似论文

  1. 海量数据压缩、操作和处理方法的研究,TP311.13
  2. 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
  3. 数据空间中基于主题词汇的概率聚类算法的研究与实现,TP311.13
  4. 社会化标签推荐系统中标签模糊和冗余的研究,TP391.3
  5. 彩色医学影像分割技术研究,TP391.41
  6. 贝叶斯框架下的图像显著性检测,TP391.41
  7. 单纯同调的快速计算方法及其在海量数据分析中的应用,TP274
  8. 自适应空间聚类方法研究,P208
  9. 基于多约束的建筑群聚类方法研究,P283.7
  10. VRGIS中海量数据绘制关键技术与算法研究,TP391.41
  11. 湖南省森林火灾空间建模研究,S762
  12. 基因表达数据中共调控模式的挖掘算法,TP311.13
  13. 基于密度的数据流子空间聚类算法研究,TP311.13
  14. 湖南移动网管集中云存储平台搭建与测试,TP333
  15. 基于MongoDB的关系网络分析技术研究与应用,TP311.13
  16. 基于空间聚类的农村公路网规划方法研究,U412.1
  17. 基于信息熵的高维分类型数据子空间聚类算法研究,TP311.13
  18. 高维聚类算法研究,TP311.13
  19. 汉中市城固县土地合理利用评价研究,F301
  20. 距离邻近与自然邻近典型聚类方法比较,P208
  21. 基于信息熵的空间对象群聚类算法研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com