学位论文 > 优秀研究生学位论文题录展示
面向概率数据流的离群点检测技术
作 者: 于浩
导 师: 杨晓春
学 校: 东北大学
专 业: 计算机应用技术
关键词: 滑动窗口 概率数据流 基于距离 离群点 过滤 增量维护
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 34次
引 用: 0次
阅 读: 论文下载
内容摘要
离群点检测是数据挖掘领域的一项重要技术,在网络入侵检测,传感器网络异常数据检测等方面具有很高的应用价值。该技术在确定性数据流领域已经得到了深入的研究,但在概率数据流领域,却是一项新的研究课题。概率数据流是近年来新兴的一种数据模型,概率数据以数据流的形式呈现,兼有概率数据和数据流的双重特点。概率数据描述事物的不确定性,能够更加真实的反映客观世界,在某些实际应用中使用概率数据模型可以提高实际可行性;但与此同时,不确定性也为数据管理带来新的挑战。因此,概率数据流管理在满足数据流管理要求的同时,还要解决不确定性带来的问题。本文最先提出面向概率数据流的离群点检测问题,并对概率数据流中基于距离的离群点检测技术进行初步的探索,以目前数据流处理技术中最常用的滑动窗口模型为框架,以相互独立的离散概率值描述元组的存在不确定性。由于不确定性的引入,原有确定性数据中基于距离的离群点定义不再有效。本文提出基于距离的不确定离群点定义,以概率做为新的判断标准。单窗口检测是完成整个数据流检测的基础,它的任务是针对每个窗口快照获取检测结果。本文在前期工作的部分成果的基础上,找到支持单窗口检测的过滤原理,并基于该过滤原理提出单窗口检测方法PDA,有效解决单窗口的检测问题。通过对PDA方法在滑动窗口上扩展应用,本文得到面向概率数据流的离群点检测的基本方法WPDA,并分析其优缺点。窗口信息的增量维护是滑动窗口模型的重要特征,目的是利用窗口滑动后保留的部分历史信息减少处理代价。本文结合过滤原理提出窗口的增量维护机制,避免WPDA方法的重复处理,并基于该机制提出针对WPDA的优化方法OWPDA。本文在实验中针对WPDA和OWPDA方法的检测效率进行测试和比较,并对实验结果加以分析。实验结果表明,得益于窗口的增量维护机制,OWPDA较WPDA有更高的检测效率。
|
全文目录
相似论文
- 粉末活性炭—超滤工艺处理微污染地表水试验研究,X703
- 个性化检索中相似用户群的获取与更新,TP391.3
- 基于WINDOWS平台文件安全机制的研究,TP309
- 一种多数据流聚类异常检测算法,TP311.13
- 不确定移动对象的异常点检测技术,TP311.13
- 滑动窗口内基于密度网格的数据流聚类算法研究,TP311.13
- 改进的协同过滤算法在推荐系统中的研究,TP391.3
- Web点击流数据的聚类技术研究,TP311.13
- 多路空间距离连接查询技术的研究与应用,TP391.3
- 面向实时监控应用的事件流相似性分析技术的研究,TP311.13
- 基于P4P的流媒体点播系统研究与实现,TN948.64
- 基于PBA磁盘加密系统的驱动和密钥管理研究,TP309.7
- 基于密度的局部离群点挖掘算法研究,TP311.13
- 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
- 针对冷启动推荐的分布式协同过滤研究,TP391.3
- 基于CryptoAPI和文件系统过滤驱动技术的数据安全存储研究,TP309
- 深海微生物采集系统仿真与实验研究,Q938.8
- 基于滑动窗口的数据流预测聚集查询处理的研究,TP311.13
- 数据流重复数据检测方法的研究,TP311.13
- 基于可变滑动窗口的数据流闭合频繁模式挖掘研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|