学位论文 > 优秀研究生学位论文题录展示

面向概率数据流的离群点检测技术

作 者: 于浩
导 师: 杨晓春
学 校: 东北大学
专 业: 计算机应用技术
关键词: 滑动窗口 概率数据流 基于距离 离群点 过滤 增量维护
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 34次
引 用: 0次
阅 读: 论文下载
 

内容摘要


离群点检测是数据挖掘领域的一项重要技术,在网络入侵检测,传感器网络异常数据检测等方面具有很高的应用价值。该技术在确定性数据流领域已经得到了深入的研究,但在概率数据流领域,却是一项新的研究课题。概率数据流是近年来新兴的一种数据模型,概率数据以数据流的形式呈现,兼有概率数据和数据流的双重特点。概率数据描述事物的不确定性,能够更加真实的反映客观世界,在某些实际应用中使用概率数据模型可以提高实际可行性;但与此同时,不确定性也为数据管理带来新的挑战。因此,概率数据流管理在满足数据流管理要求的同时,还要解决不确定性带来的问题。本文最先提出面向概率数据流的离群点检测问题,并对概率数据流中基于距离的离群点检测技术进行初步的探索,以目前数据流处理技术中最常用的滑动窗口模型为框架,以相互独立的离散概率值描述元组的存在不确定性。由于不确定性的引入,原有确定性数据中基于距离的离群点定义不再有效。本文提出基于距离的不确定离群点定义,以概率做为新的判断标准。单窗口检测是完成整个数据流检测的基础,它的任务是针对每个窗口快照获取检测结果。本文在前期工作的部分成果的基础上,找到支持单窗口检测的过滤原理,并基于该过滤原理提出单窗口检测方法PDA,有效解决单窗口的检测问题。通过对PDA方法在滑动窗口上扩展应用,本文得到面向概率数据流的离群点检测的基本方法WPDA,并分析其优缺点。窗口信息的增量维护是滑动窗口模型的重要特征,目的是利用窗口滑动后保留的部分历史信息减少处理代价。本文结合过滤原理提出窗口的增量维护机制,避免WPDA方法的重复处理,并基于该机制提出针对WPDA的优化方法OWPDA。本文在实验中针对WPDA和OWPDA方法的检测效率进行测试和比较,并对实验结果加以分析。实验结果表明,得益于窗口的增量维护机制,OWPDA较WPDA有更高的检测效率。

全文目录


相似论文

  1. 粉末活性炭—超滤工艺处理微污染地表水试验研究,X703
  2. 个性化检索中相似用户群的获取与更新,TP391.3
  3. 基于WINDOWS平台文件安全机制的研究,TP309
  4. 一种多数据流聚类异常检测算法,TP311.13
  5. 不确定移动对象的异常点检测技术,TP311.13
  6. 滑动窗口内基于密度网格的数据流聚类算法研究,TP311.13
  7. 改进的协同过滤算法在推荐系统中的研究,TP391.3
  8. Web点击流数据的聚类技术研究,TP311.13
  9. 多路空间距离连接查询技术的研究与应用,TP391.3
  10. 面向实时监控应用的事件流相似性分析技术的研究,TP311.13
  11. 基于P4P的流媒体点播系统研究与实现,TN948.64
  12. 基于PBA磁盘加密系统的驱动和密钥管理研究,TP309.7
  13. 基于密度的局部离群点挖掘算法研究,TP311.13
  14. 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
  15. 针对冷启动推荐的分布式协同过滤研究,TP391.3
  16. 基于CryptoAPI和文件系统过滤驱动技术的数据安全存储研究,TP309
  17. 深海微生物采集系统仿真与实验研究,Q938.8
  18. 基于滑动窗口的数据流预测聚集查询处理的研究,TP311.13
  19. 数据流重复数据检测方法的研究,TP311.13
  20. 基于可变滑动窗口的数据流闭合频繁模式挖掘研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com