学位论文 > 优秀研究生学位论文题录展示
存储系统中多维元数据索引的高效更新方法研究
作 者: 高梦颖
导 师: 冯丹
学 校: 华中科技大学
专 业: 计算机系统结构
关键词: 元数据管理 索引结构 R树 布隆过滤器 点查询 范围查询
分类号: TP333
类 型: 硕士论文
年 份: 2011年
下 载: 18次
引 用: 0次
阅 读: 论文下载
内容摘要
随着信息量的增长,大规模存储系统的存储容量从以前的TB(Terabyte)级上升到PB(Petabyte)级甚至EB(Exabyte)级,使得查找和处理文件变得越来越困难。现有的基于层次目录树结构的数据存储系统的扩展性和功能性不能有效地满足大规模文件系统中快速增长的数据量和复杂元数据查询的需求。有效地对存储系统元数据进行组织,比如建立各种索引结构,可以提供各种复杂的查询服务,帮助用户更好地使用文件系统。提出了使用结合R树和布隆过滤器索引来支持多维元数据的索引功能的结构,以支持多种复杂的元数据查询,如点查询、范围查询、K最邻近查询和模糊查询等。由于现有的关于R树的研究主要考虑静态数据,只关注高效的查询处理,R树本身的更新性能较低,特别是应用在海量文件元数据频繁更新的环境下,直接对索引的修改会产生大量的磁盘操作并可能引起索引结构的不平衡。研究的主要内容是结合多版本(versioning)的思想,提出一个基于R树索引结构的更新策略,将一批更新数据看作一个新增的版本。减少更新操作的次数,解决热点数据反复更新问题;同时批量操作数据的更新;使用多个版本结构,利用数据的局部特性优化更新算法。通过与已有的更新算法进行比较和分析,更新策略采用缓存更新数据的方法,可以有效地提高更新效率,减少更新操作的时间代价;同时点查询效率也有所提高,而范围查询效率有略微的下降。
|
全文目录
摘要 4-5 Abstract 5-8 1 绪论 8-18 1.1 课题背景 8-12 1.2 相关工作 12-17 1.3 本文研究的主要内容 17-18 2 多维元数据索引结构 18-24 2.1 R 树结构简介 18-20 2.2 布隆过滤器结构简介 20-21 2.3 RBF 索引结构及特点 21-23 2.4 本章小结 23-24 3 多维元数据索引更新系统的设计与实现 24-38 3.1 更新系统总体结构 24-31 3.2 建立版本模块 31-32 3.3 数据更新模块 32-37 3.4 本章总结 37-38 4 基于更新系统的索引查询功能的设计与实现 38-44 4.1 点查询 38-39 4.2 范围查询 39-41 4.3 K 最邻近查询 41-43 4.4 本章小结 43-44 5 性能测试与分析 44-48 5.1 点查询延迟 44 5.2 范围查询延迟 44-45 5.3 更新性能比较 45-47 5.4 存储空间 47 5.5 本章小结 47-48 6 总结 48-50 致谢 50-51 参考文献 51-55 附录 55
|
相似论文
- 卫星光通信粗瞄控制系统的设计及故障诊断,V443.1
- 病险水库溃坝概率分析方法研究,TV697
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- 多邮件自动文摘的关键技术研究,TP391.1
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- 基于支持向量机的故障诊断方法研究,TP18
- 紫金山树木菌根多样性的调查分析,S718.81
- 新疆油田地面工程造价指标和管理信息系统的研究与应用,F284
- 鸡传染性支气管炎病毒河南地方株分离鉴定及HN104株与HN091株全基因组序列测定,S852.65
- 树鼩和猕猴精子冷冻保存工艺的创建和优化的研究,S865.1
- 果胶高效降解菌株的紫外诱变选育、生物特性及其生物脱胶应用研究,TS713
- 梨树枝梢处理及高接换种技术研究,S661.2
- 古树名木综合价值评价研究,S788
- 树突状细胞在多柔比星诱导的大鼠肾纤维化模型中的作用,R692.5
- ATN中敏感信息保护技术研究,TP309
- 铜污染区的外生菌根菌群体多样性特征调查及外生菌根菌对尾砂矿区树木幼苗定植和生长的影响,X173
- P-选择蛋白对人单核细胞源性树突状细胞分化和免疫功能成熟的影响,R543.5
- 危险品道路运输的安全问题及对策研究,U492.81
- 喹啉环取代喜树碱的定量构效关系研究,R914
- 高校人力资源管理外包研究,G647
- 海人酸致痫大鼠神经元树突棘的可塑性变化,R742.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 存贮器
© 2012 www.xueweilunwen.com
|