学位论文 > 优秀研究生学位论文题录展示
高端容错计算机故障注入工具的设计与实现
作 者: 王波
导 师: 左徳承
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 故障注入 容错性能评测 故障注入模型 安腾架构
分类号: TP302.8
类 型: 硕士论文
年 份: 2011年
下 载: 65次
引 用: 0次
阅 读: 论文下载
内容摘要
高端容错计算机是指同时具备高性能和高可用特性的高端服务器。高端容错计算机主要面向金融、电信等涉及到国家战略安全的关键领域的计算需求,此类系统的可靠运行直接关系到国家经济安全。高端容错计算机在软件,固件,硬件等多个层次上设计了容错机制,在高端容错计算机研发过程中和投入使用前,必须进行容错性能的测试,一方面对生产厂商提供反馈意见,另一方面对容错性能进行评价。故障注入是评测容错性能最常用,也是最有效的方法。本文对如何运用故障注入方法评测容错性能进行了研究,主要解决故障注入模型的建立和故障注入工具的实现两个问题。以FARM这一经典故障注入模型为理论基础,本文构建了应用于高端容错计算机容错性能评测的故障注入模型,并对故障注入的实验策略进行了说明。在故障模型的指导下,实现了故障集中各种软硬件故障的注入,在应用层,系统层,内核层和驱动层等多个层次设计实现了一系列故障注入工具,形成了容错性能测试工具集。本文针对计算密集型,访存密集型和IO密集型三类典型应用场景,设计实现了3个故障注入工具:基于ptrace的应用进程寄存器故障注入工具,软件实现的物理地址内存故障注入工具,网络设备故障注入工具。这三个故障注入工具分别注入CPU故障、内存故障和IO故障。为了验证本文所实现的故障注入工具的有效性,也为了说明基于故障注入评测容错性能的过程,本文选择了两款安腾架构的高端容错计算机进行故障注入实验,针对Linux IA64、HP-UX和某国产容错操作系统三个操作系统进行了应用进程寄存器故障,应用进程内存故障,系统进程内存故障,内核内存故障和网络设备故障共5类故障注入测试。实验结果表明,本文所设计实现的故障注入工具的有效性,充分暴露了目标系统的各种缺陷与不足,而且能够支持多个架构和操作系统平台。通过对不同服务器和不同操作系统进行实验数据对比分析,能够对各系统的容错性能进行定性评价。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第1章 绪论 8-15 1.1 课题背景 8-10 1.1.1 课题来源 8 1.1.2 容错及其重要性 8-9 1.1.3 容错性能评测的意义 9-10 1.2 国内外研究现状 10-13 1.2.1 故障注入技术研究现状 10 1.2.2 故障注入概述 10-12 1.2.3 经典的故障注入工具 12-13 1.3 本文主要研究内容 13-15 第2章 针对安腾架构的故障注入模型 15-26 2.1 基于FARM 的故障注入模型 15-18 2.1.1 故障集F 15-16 2.1.2 激活集A 16 2.1.3 读回集R 16-17 2.1.4 度量集M 17 2.1.5 故障注入模型分类 17-18 2.2 高端容错计算机故障注入模型 18-25 2.2.1 安腾架构的高端容错计算机特点 18-21 2.2.2 故障集 21-24 2.2.3 工作负载 24 2.2.4 结果回收 24 2.2.5 评测目标 24-25 2.3 故障注入策略 25 2.4 本章小结 25-26 第3章 故障注入工具设计与实现 26-41 3.1 基于 ptrace 的进程级寄存器故障注入工具 27-32 3.1.1 故障注入原理 27 3.1.2 总体设计与工作流程 27-28 3.1.3 主要模块实现 28-31 3.1.4 支持的故障集 31-32 3.2 软件实现的内存故障注入工具 32-37 3.2.1 故障注入原理 32-33 3.2.2 总体设计与工作流程 33-34 3.2.3 主要模块实现 34-37 3.2.4 支持的故障集 37 3.3 网络设备故障注入工具 37-40 3.3.1 故障注入原理 37-39 3.3.2 模块划分与实现 39-40 3.3.3 支持的故障集 40 3.4 本章小结 40-41 第4章 容错性能评测实验 41-59 4.1 实验环境 41-43 4.2 应用进程寄存器故障注入实验 43-49 4.3 应用进程内存故障注入实验 49-54 4.4 系统进程内存故障注入实验 54-56 4.5 内核内存故障注入实验 56-57 4.6 网络设备故障注入实验 57 4.7 实验结果分析与总结 57-59 结论 59-60 参考文献 60-63 攻读硕士学位期间发表的论文及其它成果 63-65 致谢 65
|
相似论文
- 分布式系统的故障注入方法研究,TP338.8
- 面向软件的故障注入工具的研究与实现,TP311.52
- SRAM型FPGA单粒子故障传播特性与测试方法研究,V467
- CTCS-3级列控系统的UML建模与模型检验研究,TP273
- 计算机系统可信性评测研究与设计,TP311.52
- 高可靠星载双机备份系统的设计与评估,TP309.3
- 基于SCSI故障注入的可用性评测工具设计与实现,TP333
- 面向安腾2处理器的故障注入工具设计与实现,TP332
- 一种容错计算机原型机的容错性能评测方法的研究与实现,TP302.8
- Linux操作系统内核可靠性评测方法研究,TP316.81
- 通讯故障注入测试系统的研究与实现,TP311.52
- 分布式文件系统容错能力测试平台的设计与实现,TP302.8
- 基于JTAG的CPU故障注入工具的设计与实现,TP332
- 基于CPCI总线的故障模拟系统的研究与实现,TP302.8
- EMP效应下计算机容错性能测试系统的研究与实现,TP302.8
- 软件故障注入及软件脆弱点检测方法研究,TP311.52
- 基于事件注入的面向应用的软件健壮性评测,TP311.52
- 基于软件实现的故障注入的系统健壮性测试研究,TP311.52
- 基于Linux的无人机故障注入与分析系统软件研究,V267
- 基于FPGA的DDR2 SDRAM UDIMM内存故障注入工具的设计,TP333.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析 > 容错技术
© 2012 www.xueweilunwen.com
|