学位论文 > 优秀研究生学位论文题录展示

高端容错计算机故障注入工具的设计与实现

作 者: 王波
导 师: 左徳承
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 故障注入 容错性能评测 故障注入模型 安腾架构
分类号: TP302.8
类 型: 硕士论文
年 份: 2011年
下 载: 65次
引 用: 0次
阅 读: 论文下载
 

内容摘要


高端容错计算机是指同时具备高性能和高可用特性的高端服务器。高端容错计算机主要面向金融、电信等涉及到国家战略安全的关键领域的计算需求,此类系统的可靠运行直接关系到国家经济安全。高端容错计算机在软件,固件,硬件等多个层次上设计了容错机制,在高端容错计算机研发过程中和投入使用前,必须进行容错性能的测试,一方面对生产厂商提供反馈意见,另一方面对容错性能进行评价。故障注入是评测容错性能最常用,也是最有效的方法。本文对如何运用故障注入方法评测容错性能进行了研究,主要解决故障注入模型的建立和故障注入工具的实现两个问题。以FARM这一经典故障注入模型为理论基础,本文构建了应用于高端容错计算机容错性能评测的故障注入模型,并对故障注入的实验策略进行了说明。在故障模型的指导下,实现了故障集中各种软硬件故障的注入,在应用层,系统层,内核层和驱动层等多个层次设计实现了一系列故障注入工具,形成了容错性能测试工具集。本文针对计算密集型,访存密集型和IO密集型三类典型应用场景,设计实现了3个故障注入工具:基于ptrace的应用进程寄存器故障注入工具,软件实现的物理地址内存故障注入工具,网络设备故障注入工具。这三个故障注入工具分别注入CPU故障、内存故障和IO故障。为了验证本文所实现的故障注入工具的有效性,也为了说明基于故障注入评测容错性能的过程,本文选择了两款安腾架构的高端容错计算机进行故障注入实验,针对Linux IA64、HP-UX和某国产容错操作系统三个操作系统进行了应用进程寄存器故障,应用进程内存故障,系统进程内存故障,内核内存故障和网络设备故障共5类故障注入测试。实验结果表明,本文所设计实现的故障注入工具的有效性,充分暴露了目标系统的各种缺陷与不足,而且能够支持多个架构和操作系统平台。通过对不同服务器和不同操作系统进行实验数据对比分析,能够对各系统的容错性能进行定性评价。

全文目录


摘要  4-5
ABSTRACT  5-8
第1章 绪论  8-15
  1.1 课题背景  8-10
    1.1.1 课题来源  8
    1.1.2 容错及其重要性  8-9
    1.1.3 容错性能评测的意义  9-10
  1.2 国内外研究现状  10-13
    1.2.1 故障注入技术研究现状  10
    1.2.2 故障注入概述  10-12
    1.2.3 经典的故障注入工具  12-13
  1.3 本文主要研究内容  13-15
第2章 针对安腾架构的故障注入模型  15-26
  2.1 基于FARM 的故障注入模型  15-18
    2.1.1 故障集F  15-16
    2.1.2 激活集A  16
    2.1.3 读回集R  16-17
    2.1.4 度量集M  17
    2.1.5 故障注入模型分类  17-18
  2.2 高端容错计算机故障注入模型  18-25
    2.2.1 安腾架构的高端容错计算机特点  18-21
    2.2.2 故障集  21-24
    2.2.3 工作负载  24
    2.2.4 结果回收  24
    2.2.5 评测目标  24-25
  2.3 故障注入策略  25
  2.4 本章小结  25-26
第3章 故障注入工具设计与实现  26-41
  3.1 基于 ptrace 的进程级寄存器故障注入工具  27-32
    3.1.1 故障注入原理  27
    3.1.2 总体设计与工作流程  27-28
    3.1.3 主要模块实现  28-31
    3.1.4 支持的故障集  31-32
  3.2 软件实现的内存故障注入工具  32-37
    3.2.1 故障注入原理  32-33
    3.2.2 总体设计与工作流程  33-34
    3.2.3 主要模块实现  34-37
    3.2.4 支持的故障集  37
  3.3 网络设备故障注入工具  37-40
    3.3.1 故障注入原理  37-39
    3.3.2 模块划分与实现  39-40
    3.3.3 支持的故障集  40
  3.4 本章小结  40-41
第4章 容错性能评测实验  41-59
  4.1 实验环境  41-43
  4.2 应用进程寄存器故障注入实验  43-49
  4.3 应用进程内存故障注入实验  49-54
  4.4 系统进程内存故障注入实验  54-56
  4.5 内核内存故障注入实验  56-57
  4.6 网络设备故障注入实验  57
  4.7 实验结果分析与总结  57-59
结论  59-60
参考文献  60-63
攻读硕士学位期间发表的论文及其它成果  63-65
致谢  65

相似论文

  1. 分布式系统的故障注入方法研究,TP338.8
  2. 面向软件的故障注入工具的研究与实现,TP311.52
  3. SRAM型FPGA单粒子故障传播特性与测试方法研究,V467
  4. CTCS-3级列控系统的UML建模与模型检验研究,TP273
  5. 计算机系统可信性评测研究与设计,TP311.52
  6. 高可靠星载双机备份系统的设计与评估,TP309.3
  7. 基于SCSI故障注入的可用性评测工具设计与实现,TP333
  8. 面向安腾2处理器的故障注入工具设计与实现,TP332
  9. 一种容错计算机原型机的容错性能评测方法的研究与实现,TP302.8
  10. Linux操作系统内核可靠性评测方法研究,TP316.81
  11. 通讯故障注入测试系统的研究与实现,TP311.52
  12. 分布式文件系统容错能力测试平台的设计与实现,TP302.8
  13. 基于JTAG的CPU故障注入工具的设计与实现,TP332
  14. 基于CPCI总线的故障模拟系统的研究与实现,TP302.8
  15. EMP效应下计算机容错性能测试系统的研究与实现,TP302.8
  16. 软件故障注入及软件脆弱点检测方法研究,TP311.52
  17. 基于事件注入的面向应用的软件健壮性评测,TP311.52
  18. 基于软件实现的故障注入的系统健壮性测试研究,TP311.52
  19. 基于Linux的无人机故障注入与分析系统软件研究,V267
  20. 基于FPGA的DDR2 SDRAM UDIMM内存故障注入工具的设计,TP333.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析 > 容错技术
© 2012 www.xueweilunwen.com