学位论文 > 优秀研究生学位论文题录展示

海量存储系统中并行文件系统的测试与优化

作 者: 周凡夫
导 师: 管海兵
学 校: 上海交通大学
专 业: 计算机技术
关键词: 海量存储 并行文件系统 预取 缓存 条带化
分类号: TP333
类 型: 硕士论文
年 份: 2012年
下 载: 128次
引 用: 0次
阅 读: 论文下载
 

内容摘要


海量存储系统(Mass Storage System)是为存储海量数据而研制的存储系统,其本质特征在于该存储系统的可扩展性,即能在扩展系统容量和性能的同时,不增加系统管理的复杂性。并行文件系统(Parallel File System)是由一组节点(Node)组成的,这组节点通过相互之间的通信与协作,以更快的速度完成一项大规模的计算任务。并行文件系统是构筑高性能海量存储系统的基石,所以无论是在高性能计算还是在云存储都有着重要的研究意义,因此近年来得到广泛的关注和研究。并行文件系统的测试,大致包括一致性测试、功能测试、压力测试、性能测试、推测性测试等,其中性能测试其中的重点。并行文件系统性能的测试测试的指标大致有两个,一个是吞吐量,衡量大文件I/O读写能力;另一个是IOPS,衡量小文件读写能力。常用优化并行文件系统性能的策略有数据预取,数据缓存、合并小顺序I/O、条带化等技术。缓存指利用缓冲区保存最近访问过的文件内容,以提高对文件的访问效率。预取是指在实际使用内存时提前将数据读取到内存中,从而提高访问效率。合并小顺序I/O,则是将若干个小文件的操作聚合成一个大文件的操作,从而减小磁盘操作的次数。条带化是把连续的数据块分割成相同大小的数据块,将每段数据分别写入到阵列中不同的磁盘。本文主要研究并行文件系统的测试方法,以及优化性能的策略。研究内容主要包括:研究并行文件系统性能测试的标准及方法、学习改进文件系统性能的测试的方法、以GlusterFS为例验证各优化策略的效果。实验证明GlusterFS中的缓存策略改善了超过10MB/s的读性能,预取策略的两个方法合计提供了约15MB/s的读性能。

全文目录


摘要  3-5
ABSTRACT  5-11
第一章 绪论  11-25
  1.1 研究背景  11-15
    1.1.1 应用需求  11-12
    1.1.2 存储系统结构  12-15
  1.2 分布式文件系统  15-22
    1.2.1 分布式文件系统的分类  15-16
    1.2.2 典型的分布式文件系统  16-22
  1.3 研究目标  22-23
  1.4 论文的主要工作  23
  1.5 论文结构  23-25
第二章 基准测试  25-32
  2.1 测试指标  25-26
  2.2 测试基准  26-31
    2.2.1 宏观基准  27-29
    2.2.2 回放trace  29-30
    2.2.3 微观基准  30-31
  2.3 本章小结  31-32
第三章 优化策略  32-56
  3.1 GLUSTERFS  32-37
    3.1.1 Translator  33-35
    3.1.2 集群模式  35-37
  3.2 数据预取优化技术  37-42
    3.2.1 预取  37
    3.2.2 Stat-prefetch  37-39
    3.2.3 Read-ahead  39-42
  3.3 缓存优化技术  42-45
    3.3.1 缓存  42
    3.3.2 Io-cache  42-45
  3.4 合并顺序小I/O 优化技术  45-47
    3.4.1 合并顺手小I/O  45
    3.4.2 Write-behind  45-47
  3.5 条带化优化技术  47-49
    3.5.1 条带化  47-48
    3.5.2 Stripe Translator  48-49
  3.6 多线程优化技术  49-53
    3.6.1 线程  49-51
    3.6.2 Io-threads  51-53
  3.7 固态硬盘优化技术  53-55
    3.7.1 优缺点  54-55
  3.8 本章小结  55-56
第四章 实验与分析  56-59
  4.1 实验环境  56
  4.2 实验方案  56-58
    4.2.1 测试步骤  56-57
    4.2.2 测试结果与分析  57-58
  4.3 本章小结  58-59
第五章 总结与展望  59-61
  5.1 论文总结  59
  5.2 展望  59-61
参考文献  61-65
致谢  65-66
攻读硕士期间的科研及学术论文  66-69
  科研项目  66
  学术论文  66-69
附件  69

相似论文

  1. CMOS星敏感器图像采集系统研究,V448.2
  2. Web缓存技术的研究,TP333
  3. 高效能嵌入式处理器IP核,TP332
  4. 海量存储系统集群部署研究,TP333
  5. 多应用环境下自适应预取策略研究,TP333
  6. 一个分布式作战指挥仿真系统的设计与实现,TP311.52
  7. 分布式文件系统客户端的设计与实现,TP338.8
  8. 基于云技术的分布式实时数据库高性能数据存储检索机制的研究,TP311.13
  9. 海量存储系统的性能管理与监测方法研究,TP333
  10. BlueOcean海量存储系统客户端的设计与实现,TP333
  11. 海量存储系统中高可用服务管理的设计与实现,TP333
  12. 海量存储系统数据节点的设计与实现,TP333
  13. 基于缓存预取在线考试系统的分析与实现,TP311.52
  14. 基于SCSI故障注入的可用性评测工具设计与实现,TP333
  15. 基于VxWorks的USB驱动研究与实现,TP336
  16. 基于SATA硬盘阵列的高速数据存取技术研究,TP333
  17. 集群环境下海量数据存储管理技术的研究,TP333
  18. 嵌入式系统中USB海量存储设备的设计与实现,TP368.1
  19. 基于双关联图的Web预取模型研究,TP393.09
  20. 流媒体分类播放技术研究与设计,TN919.8

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 存贮器
© 2012 www.xueweilunwen.com