学位论文 > 优秀研究生学位论文题录展示
聚类挖掘研究及其在隧道病害评价中的应用
作 者: 王羽婷
导 师: 徐维祥
学 校: 北京交通大学
专 业: 系统分析与集成
关键词: 数据挖掘 聚类 模糊聚类 FRC 隧道病害
分类号: TP311.13
类 型: 硕士论文
年 份: 2007年
下 载: 80次
引 用: 1次
阅 读: 论文下载
内容摘要
信息社会对海量数据的处理能力提出了更高的要求。数据挖掘技术伴随着这种需求应运而生,已成为信息技术研究的热点之一。而聚类挖掘是数据挖掘技术中被广泛采用的技术之一。本文主要对模糊聚类算法FCM进行了改进:结合竞争聚类算法CA、健壮性算法NC和关系型聚类算法FRC,提出了新的目标函数,并借鉴以上几种算法的推导方法,推导出隶属度的迭代公式。该算法具有以下特点:第一,通过竞争因子,使大量的初始聚类逐渐退化到最佳数目的聚类,可以解决传统算法由于缺乏先验知识而产生的聚类数目不合理的问题;第二,通过引入噪声类项,使得算法对孤立点有良好的适应性,从而更加健壮;第三,在目标函数中直接引入相异度函数,使得算法可以直接适用于非欧几里德距离的关系数据。此外,本文在研究基于划分的聚类算法的基础上,对k-均值算法进行改进,提出PKM算法,通过计算机仿真验证了算法的优越性。结合隧道病害检测数据的特点,本文提出了从预处理到评价的有效方法。首先,对数据进行清洗,采用离散化和归一化方法对数据进行转换,并给出数据的集成方法;随后,针对预处理后的数据,应用病害数据相似(异)度的度量方法求解隧道之间的相异度;最后,采用改进的模糊聚类算法以及病害等级评价方法,对758条隧道的病害检测数据进行聚类分析,得出聚类结果,并将结果按照严重程度划分为四个等级,对应病害的四种健康状况。通过对病害状况的初步分析,本文提出若干意见和建议,为隧道病害整治和防治提供有用参考。
|
全文目录
致谢 5-6 中文摘要 6-7 ABSTRACT 7-10 1 引言 10-20 1.1 论文研究的目的和意义 10-11 1.2 研究现状 11-18 1.2.1 数据挖掘技术及研究现状 11-14 1.2.2 聚类技术研究及应用现状 14-17 1.2.3 隧道病害评价研究现状 17-18 1.3 论文的主要内容及组织结构 18-20 2 经典聚类算法及其改进 20-34 2.1 聚类问题描述 20-22 2.1.1 聚类概念 20-21 2.1.2 聚类结果的表达 21 2.1.3 聚类有效性评价 21-22 2.2 数据类型与数据结构 22-25 2.2.1 数据类型与相异度度量 22-24 2.2.2 数据结构 24-25 2.3 聚类技术主要研究问题 25-26 2.4 经典聚类算法研究 26-30 2.5 改进的聚类算法PKM 30-34 2.5.1 PKM算法 30-32 2.5.2 实验结果及分析 32-34 3 模糊聚类算法及改进 34-52 3.1 模糊聚类概述 34-35 3.1.1 模糊聚类的概念 34 3.1.2 模糊聚类一般方法 34-35 3.2 模糊 c-均值算法研究 35-38 3.2.1 FCM算法 36-37 3.2.2 FCM算法健壮性研究 37-38 3.3 模糊CA算法研究 38-39 3.4 NC健壮性算法研究 39-40 3.5 关系型模糊聚类算法研究 40-43 3.5.1 关系型FCM算法 40-41 3.5.2 FRC算法 41-43 3.5.3 关系型CA算法 43 3.6 改进的CAFRC算法 43-52 3.6.1 健壮的关系型竞争算法CAFRC 43-48 3.6.2 关系型数据实验 48-50 3.6.3 实验结果及评价 50-52 4 聚类挖掘在隧道病害评价中的应用 52-66 4.1 预处理方法 52-56 4.1.1 数据清洗 52-53 4.1.2 数据转换 53 4.1.3 数据集成 53-56 4.2 相似度计算研究 56-61 4.2.1 数据标准化处理 56-58 4.2.2 简单相似度计算 58-59 4.2.3 复杂相似度计算 59-61 4.3 聚类算法研究 61-64 4.3.1 隧道数据的特点 61 4.3.2 聚类算法改进 61-63 4.3.3 聚类结果评价法 63-64 4.4 聚类结果及分析 64-66 5 结束语 66-68 5.1 研究工作总结 66 5.2 下一步研究展望 66-68 参考文献 68-70 附录 A 70-73 附录 B 73-76 附录 C 76-89 作者简历 89-91
|
相似论文
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 图像分割中阴影去除算法的研究,TP391.41
- 基于图分割的文本提取方法研究,TP391.41
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- K-均值聚类算法的研究与改进,TP311.13
- 大学生综合素质测评研究,G645.5
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- 南通市农业面源污染负荷研究与综合评价,X592
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 大豆杂种优势及其遗传基础研究,S565.1
- 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
- Bicluster数据分析软件设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|