学位论文 > 优秀研究生学位论文题录展示
从XML历史变化版本中发现频繁变化结构
作 者: 郭建芳
导 师: 李雄飞
学 校: 吉林大学
专 业: 计算机软件与理论
关键词: 频繁变化结构挖掘 动态性 空间变化 ADAW-DOM数据模型
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 19次
引 用: 0次
阅 读: 论文下载
内容摘要
XML作为Internet上数据表示和数据交换的重要标准得到广泛的研究与应用。当前,XML数据挖掘主要是从大量的静态快照XML数据中发现有用的知识,如频繁子树挖掘。XML数据特性之一在于动态变化性,XML文档可以在任何时刻以任何方式发生变化。频繁变化结构挖掘是从同一个XML文档的一系列历史变化版本中发现变化频繁且变化显著的子结构,然而所发现的FCS表明某子结构在历史变化过程中其变化程度达到了用户的关注水平,其并没有真正反映出空间结构变化情况。而且,我们运用传统XML静态挖掘算法无法获得变化过程中隐含的有趣的知识。本文在分析XML文档相邻版本变化检测算法X-Diff以及传统FCS挖掘基础上,针对传统FCS挖掘算法的不足,提出了一种有意义的知识发现问题,即从XML文档的一系列历史变化版本中发现平均深度和平均宽度发生变化达到我们所关注程度的子结构。文中提出带有深度和宽度信息的数据模型ADAW-DOM,给出模型构建算法ADAWdomT和频繁变化子结构挖掘算法ADAWfcsM,并在实验室环境下进行测试。实验结果表明,子结构挖掘时间开销主要集中在数据模型建立阶段,算法比较适合于中、小规模文档变化操作;在随机生成的XML文档历史变化过程中,算法可以有效地进行子结构挖掘。
|
全文目录
相似论文
- 社会消费方式变迁下的服装终端空间变化之研究,TS941.1
- 螺旋式上升理论指导下的语文学科性质的分析,G633.3
- 分布式动态交通信息挖掘及导航,TP311.13
- 企业家自我效能对战略变革影响研究,F224
- 桤木人工林根系形态、生物量和养分分布特性,S792.14
- 语言中的文化认同—对《我父亲的梦想》语篇语用分析,H315
- 语篇动态性的系统功能语言学研究,H052
- 工作流动态构建技术研究及应用,TP311.52
- 宁波市工业发展与空间分异研究,F427
- 图文并茂—彩陶纹样与象形文字的解读与数字化演绎,J522
- 基于意义协调理论的语境动态性研究,H030
- 动态工作流的Petri网建模技术和服务质量分析,TP311.52
- 象山港电厂临近海域海洋微生物的分子生态多样性研究,Q938
- 新课标教科书动态性评价的研究,G420
- 外资空间分布及其变化对闽东南区域与城市发展的影响,F127
- 基于构件的可插拔服务模型框架的设计与实现,TP311.52
- 基于多重网格算法的遥感图像恢复方法研究,TP391.41
- 基于事件—规则机制的工作流技术的研究,TP311.52
- PPP项目动态集成化风险管理研究,F283
- 基于准静态场景的认知无线电频谱共享新算法的研究,TN92
- P2P网络信任模型的研究,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|