学位论文 > 优秀研究生学位论文题录展示

不确定数据流聚类算法的研究与实现

作 者: 方易
导 师: 王国仁
学 校: 东北大学
专 业: 计算机系统结构
关键词: 不确定性 数据流 聚类 数据挖掘
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 90次
引 用: 0次
阅 读: 论文下载
 

内容摘要


传统的确定数据流管理系统及技术在近几年中得到了长足的发展并形成了成熟的研究领域。然而,随着信息产业各领域的不断发展和近似测量数据的硬件被大量应用,使得对不确定数据的研究形成了相应的领域并取得了相应的成果。在实际应用中,由于测量的不准确性,数据传输中引入的噪音以及数据源本身具有的不确定性,使得流数据的不确定性广泛存在并成为流数据的一个固有性质。因此对不确定性数据流的管理技术及其处理技术越来越被关注和重视。随着数据挖掘技术的广泛运用,近年来对不确定数据的挖掘做了大量的工作及相关研究。数据挖掘中的一个重要研究课题是聚类,对不确定数据流聚类算法的研究有重要的意义。在聚类过程中,描述对象间的相似程度以及簇间的相异程度通常是用距离来衡量的,因此描述不确定对象间的距离对于不确定对象的聚类算法的研究起着至关重要的作用。本文通过分析给出了计算不确定对象间距离的改进方法:摘要估计方法(ASM),该方法在计算不确定对象间距离时考虑了不确定对象的分布情况,将偏差纳入了计算过程,进而提高计算结果的准确度。然后提出了计算不确定对象与集合间距离的改进方法:平均组合距离(MPD)。与传统方法不同的是,MPD方法考虑了簇内所有元素对结果的影响,并将不确定对象与簇内所有元素距离的平均值作为不确定对象与集合间的距离。之后,提出了聚类过程中描述簇统计信息的向量:簇信息向量,该向量记录簇内所有元素的平方和等相关信息。最后,提出了一种不确定数据流聚类算法UKluStream,并通过实验验证了算法的有效性。

全文目录


相似论文

  1. 小型望远镜防抖系统的设计与工程实现,TH743
  2. 隐式用户兴趣挖掘的研究与实现,TP311.13
  3. 图像分割中阴影去除算法的研究,TP391.41
  4. 基于图分割的文本提取方法研究,TP391.41
  5. 离散切换系统稳定性分析及控制器设计,TP13
  6. 随机时滞系统的稳定性分析与鲁棒控制器设计,TP13
  7. 时滞系统的稳定性分析,TP13
  8. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  9. 高血压前期证候特征研究,R259
  10. 基于数据挖掘技术的保健品营销研究,F426.72
  11. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  12. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  13. K-均值聚类算法的研究与改进,TP311.13
  14. 大学生综合素质测评研究,G645.5
  15. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  16. 污染场地健康与生态风险评价研究,X820.4
  17. 21个荷花品种遗传多样性的ISSR分析,S682.32
  18. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  19. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  20. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  21. 基于不确定性系统研究方法的高校学生学习成绩分析与预测,G642.4

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com