学位论文 > 优秀研究生学位论文题录展示

RFID路径数据聚类分析与频繁模式挖掘

作 者: 林国省
导 师: 邓辉舫
学 校: 华南理工大学
专 业: 计算机软件与理论
关键词: RFID 数据挖掘 路径相似度 聚类分析 频繁模式挖掘
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 205次
引 用: 2次
阅 读: 论文下载
 

内容摘要


RFID路径数据是指带有RFID标签的物品在移动过程中产生的路径数据。如何从大量的RFID路径数据中提取有用的信息和知识,成为一门重要的研究课题。本文结合RFID应用,分析了RFID路径数据的特点,提出了若干适用于RFID路径数据的聚类分析方法和频繁模式挖掘方法。在实际应用中,这些挖掘方法能够帮助业务决策,优化或改善业务安排和规划等。在聚类分析方面,路径对象的相似度计算是路径聚类分析算法的基础,本文借鉴了生物信息学中序列比对的相关研究成果,讨论了基于全局和局部相似性的两种路径相似度计算方法。在聚类分析算法方面,传统的聚类分析方法并不能处理RFID路径数据,本文提出了基于密度聚类的路径聚类算法DBPC。DBPC算法根据路径数据的特点,采用了新的构建簇的方法;本文还提出了路径数据的层次聚类算法PHC,使用簇成员加权方案计算簇之间的相似度;最后讨论了异常路径的检测方法和复杂路径数据聚类的可行方法。在频繁模式挖掘方面,本文修改和简化了传统的闭频繁序列挖掘算法CloSpan实现频繁模式挖掘;并基于修改的CloSpan算法提出了一种频繁模式挖掘算法CFPM。CFPM算法根据路径数据的特点,提出了基于节点计数剪枝方法,提高了剪枝效率,比修改的CloSpan算法具有更好的挖掘效率。最后本文讨论了复杂路径数据的频繁模式挖掘的可行方法。本文开发了RFID路径数据挖掘实验系统。此系统具有路径数据可视化的功能,能够直观地表现路径数据的分布和挖掘结果。实验表明,本文讨论的聚类方法和频繁模式挖掘方法能够适用于RFID路径数据。其中聚类算法DBPC和PHC算法能够形成高质量的路径簇,PHC算法具有较高的簇合并效率,路径频繁模式挖掘算法CFPM比传统的CloSpan挖掘算法提高了挖掘效率。

全文目录


摘要  5-6
Abstract  6-9
第一章 引言  9-13
  1.1 研究背景  9-11
  1.2 研究的目的和意义  11
  1.3 研究的内容和目标  11
  1.4 本文的主要工作  11-12
  1.5 本文的组织结构  12-13
第二章 路径数据特点分析及预处理技术  13-24
  2.1 RFID 路径数据的来源  13-16
  2.2 RFID 路径数据特点  16-20
    2.2.1 移动物品的类型  16
    2.2.2 简单的路径数据  16-17
    2.2.3 复杂的路径数据  17-20
    2.2.4 与其他序列数据的关系  20
  2.3 路径数据预处理技术  20-23
  2.4 路径切割  23-24
第三章 路径数据相似度计算  24-34
  3.1 双序列比对  24-26
  3.2 基于全局相似性的路径相似度计算方法  26-29
  3.3 基于局部相似性的路径相似度计算方法  29-32
  3.4 复杂路径数据的相似度计算  32-34
第四章 路径聚类分析  34-50
  4.1 路径聚类的应用  34-35
  4.2 基于密度的路径聚类算法DBPC  35-43
    4.2.1 路径数据相似度计算  36-37
    4.2.2 DBPC 算法  37-39
    4.2.3 加权共享邻居相似度  39-42
    4.2.4 DBPC 算法步骤  42-43
  4.3 路径层次聚类算法PHC  43-46
  4.4 复杂路径数据的聚类算法  46-47
  4.5 异常路径分析  47-50
第五章 路径频繁模式挖掘  50-72
  5.1 路径频繁模式挖掘应用  50-51
  5.2 路径频繁模式挖掘算法  51-54
    5.2.1 RFID 路径数据与事件序列数据  51-52
    5.2.2 路径频繁模式挖掘相关概念  52-53
    5.2.3 挖掘路径闭序列模式  53-54
  5.3 面向路径数据的PathCloSpan 算法  54-60
    5.3.1 相关概念和定义  54-59
    5.3.2 PathCloSpan 算法步骤  59-60
  5.4 面向路径数据的CFPM 算法  60-66
    5.4.1 位置节点计数剪枝  61-64
    5.4.2 近似剪枝  64-65
    5.4.3 改进的路径查找哈希表键值选择策略  65-66
  5.5 复杂路径数据的频繁模式挖掘  66-72
    5.5.1 时间相关的路径频繁模式挖掘  66-67
    5.5.2 具有额外位置信息的路径频繁模式挖掘  67
    5.5.3 多维度的频繁模式挖掘  67-72
第六章 实验分析  72-92
  6.1 RFID 路径数据挖掘实验系统  72-76
    6.1.1 路径数据可视化  73-76
  6.2 模拟路径数据集  76-77
  6.3 实验环境  77-78
  6.4 路径聚类分析实验  78-87
    6.4.1 DBPC 算法实验  78-81
    6.4.2 PHC 算法实验  81-85
    6.4.3 聚类分析结果图形表示  85-87
  6.5 路径频繁模式挖掘实验  87-92
    6.5.1 CFPM 算法实验  87-90
    6.5.2 路径频繁模式挖掘结果图形表示  90-92
第七章 总结与展望  92-95
  7.1 论文总结  92-93
  7.2 工作展望  93-95
参考文献  95-99
攻读硕士学位期间取得的研究成果  99-100
致谢  100

相似论文

  1. RFID技术在汽车点火线圈生产中的应用研究,TP391.44
  2. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  3. 高血压前期证候特征研究,R259
  4. 基于数据挖掘技术的保健品营销研究,F426.72
  5. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  6. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  7. 大学生综合素质测评研究,G645.5
  8. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  9. 21个荷花品种遗传多样性的ISSR分析,S682.32
  10. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  11. 畜产品质量安全保障监管RFID系统,TS201.6
  12. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  13. 南通市农业面源污染负荷研究与综合评价,X592
  14. 土壤环境功能区划研究,X321
  15. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  16. 大豆杂种优势及其遗传基础研究,S565.1
  17. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  18. Bicluster数据分析软件设计与实现,TP311.52
  19. 基于变异粒子群的聚类算法研究,TP18
  20. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  21. 基于遗传算法和粗糙集的聚类算法研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com