学位论文 > 优秀研究生学位论文题录展示

图结构数据聚类分析平台的研究及原型实现

作 者: 陈文俊
导 师: 陈德华
学 校: 东华大学
专 业: 计算机软件与应用
关键词: 图结构数据 聚类分析 Eclipse SSH G-LSH
分类号: TP311.13
类 型: 硕士论文
年 份: 2012年
下 载: 30次
引 用: 0次
阅 读: 论文下载
 

内容摘要


图作为一种常用的数据结构,它是由结点及其之间的边组成的,能够表达丰富的语义信息。近年来,图数据挖掘已成为数据挖掘领域的研究重点和研究热点。图聚类分析技术作为一种重要的图数据挖掘技术,是在大规模复杂网络中进行社区发现的关键技术。其目的在于利用图聚类算法在图中寻找那些联系紧密的子图,使得子图内的结点之间的联系非常紧密,而子图与子图之间的结点联系相对松散。图聚类已在化学化合物结构、生物信息、机器视觉、视频索引、文本检索和Web分析中得到了广泛的应用。本文针对图聚类的应用需求,对若干经典的图聚类算法进行了分析,在此基础上设计并实现了一套基于SSH(Struts+Spring+Hibernate)架构的图结构数据聚类分析平台。该平台集成了多种经典的图聚类算法,并可根据使用者的要求对算法的参数进行修改,使得数据的输入输出具有统一标准,及实现聚类结果可视化展现。另外,平台还考虑到未来系统的可扩展性,提供了可扩展的接口,以便新算法可在平台上实现方便的添加与部署,从而为图数据挖掘研究者提供了一个开放的、可扩展性的良好的基础平台。基于上述的研究目标,本文的研究内容主要包括:1、首先介绍了本文所涉及到的数据挖掘、图结构数据挖掘、Eclipse、MVC以及SSH架构等相关知识,以为后续的平台设计与实现奠定良好的技术基础。2、接着在经典的位置敏感哈希算法基础上,结合大规模图数据的应用需求,提出了一种适用于大规模图数据的基于位置敏感哈希的图结构数据聚类的算法G-LSH,并对该算法的基本思想和具体设计进行了详细的说明。3、然后给出了本文的图聚类分析平台的设计与实现。具体而言,围绕如何提高图聚类分析平台的可扩展性和易用性等方面的问题,提出了平台的总体框架设计,并对平台的接口设计做了详细的说明。在平台实现阶段,讨论了平台的实现细节和实现方法,包括平台的数据持久层的实现、算法库的实现以及最后聚类结果的可视化展示模块等。4、最后以生物数据集为具体应用背景,在本平台上对本文提出的G-LSH算法的性能进行了实验验证。本文的末尾对文章的相关工作做了总结,并阐述了下一步工作的展望。

全文目录


摘要  5-7
ABSTRACT  7-9
目录  9-10
第一章 绪论  10-15
  1.1 研究背景与意义  10-11
  1.2 国内外研究现状  11-12
  1.3 本文主要研究内容  12-13
  1.4 本文的组织结构  13-15
第二章 相关技术的研究进展  15-30
  2.1 数据挖掘  15-17
  2.2 聚类分析  17-20
  2.3 图数据挖掘  20-22
  2.4 J2EE技术  22-24
  2.5 MVC  24-26
  2.6 SSH架构研究  26-29
  2.7 本章小结  29-30
第三章 基于位置敏感哈希的图聚类算法  30-37
  3.1 相关概念介绍  30-32
  3.2 位置敏感哈希算法  32-35
  3.3 基于位置敏感哈希的图聚类算法  35-36
  3.5 本章小结  36-37
第四章 图结构数据聚类分析平台的设计和实现  37-54
  4.1 平台概述  37-38
  4.2 平台设计  38-41
  4.3 数据持久层的实现  41-45
  4.4 图聚类算法库模块  45-51
  4.5 数据展现模块  51-53
  4.6 本章小结  53-54
第五章 图数据聚类分析平台在生物数据分析中的应用  54-58
  5.1 BioGRID数据集介绍  54-55
  5.2 生物数据集聚类实验  55-56
  5.3 G-LSH算法实验分析  56-57
  5.5 本章小结  57-58
第六章 总结与展望  58-60
  6.1 总结  58-59
  6.2 展望  59-60
参考文献  60-63
攻读学位期间的研究成果目录  63-64
致谢  64

相似论文

  1. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  2. 铝胁迫下小黑豆的红外光谱特征分析及其铝胁迫响应基因的鉴定,S529
  3. 高血压前期证候特征研究,R259
  4. 大学生综合素质测评研究,G645.5
  5. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  6. 21个荷花品种遗传多样性的ISSR分析,S682.32
  7. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  8. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  9. 溶藻弧菌诱导红笛鲷仔鱼差减文库的构建及其表达序列标签分析,S943
  10. 南通市农业面源污染负荷研究与综合评价,X592
  11. 土壤环境功能区划研究,X321
  12. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  13. 大豆杂种优势及其遗传基础研究,S565.1
  14. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  15. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  16. 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
  17. 云南省直管县改革研究,D630
  18. 条锈菌诱导的小麦叶片SSH文库构建及其ESTs分析,S512.1
  19. 基于分治法的聚类方法研究,TP311.13
  20. 三十种中成药元素含量分析及基于元素含量的中成药分类研究,R286.0
  21. 面向社区教育的个性化学习系统的研究与实现,TP391.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com