学位论文 > 优秀研究生学位论文题录展示

分布式系统的故障注入方法研究

作 者: 石晶
导 师: 蔡则苏
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 故障注入 故障模型 星载计算机 分布式系统
分类号: TP338.8
类 型: 硕士论文
年 份: 2008年
下 载: 117次
引 用: 1次
阅 读: 论文下载
 

内容摘要


计算机的可靠性问题一直是人们关注的焦点,为了提高计算机系统的可靠性,人们采用了容错技术,因此对计算机容错性能的评测就成为了一个重要的课题。故障注入技术被证明为评测容错性能的一种有效手段。本文以评测星载计算机的容错性能为应用背景,设计了一种基于软件实现的分布式故障注入系统。重点研究了用软件实现的故障注入方法,并对其进行了仿真。本文首先阐述故障注入方法在评测星载计算机系统容错性能中的应用,并对故障注入方法进行了一些研究和比较。由于星载计算机是用于空间环境,因此会受到单粒子事件的影响,造成单粒子事件故障,这种故障主要是发生在星载计算机的存储器中,通过对内存故障进行分析,提出了适用于该故障注入系统的单粒子事件故障模型。然后,阐述了对于分布式系统故障注入的特点,并论述了在三种操作系统中的故障注入方法底层实现原理。以该故障注入系统为基础,本文又分别在信号和模块级别上研究了故障在软件中的生成与传播过程,并定义了描述此过程的参数及其计算方法,其中提出了模块泄漏率和活动率的概念,并给出了软件脆弱点的概念及确定原则。本文最后介绍了分布式故障注入仿真系统,用于验证前面所提出的基于软件实现的故障注入方法,并阐述了仿真系统的设计思想及各模块的实现功能等。然后进行了仿真实验,并对实验结果进行了分析。实验结果证明,该故障注入系统可在分布式系统或单机系统中注入多种故障,可以模拟单粒子事件对系统的影响,同时还拥有强大的数据回收功能,这为以后研究分布式系统的可靠性奠定了一定的基础。

全文目录


摘要  4-5
Abstract  5-10
第1章 绪论  10-25
  1.1 课题背景及来源  10-13
  1.2 研究故障注入的目的和意义  13-15
  1.3 故障注入技术及分类  15-21
    1.3.1 基于模拟实现的故障注入  16-18
    1.3.2 基于硬件实现的故障注入  18-20
    1.3.3 基于软件实现的故障注入  20-21
    1.3.4 混合实现的故障注入  21
  1.4 软件故障注入国内外研究现状  21-24
    1.4.1 国外研究现状  21-23
    1.4.2 国内研究现状  23-24
  1.5 本文主要研究内容及结构  24-25
第2章 单粒子事件与故障注入的研究  25-36
  2.1 引言  25-26
  2.2 单粒子事件的故障模型  26-30
    2.2.1 单粒子效应  26-27
    2.2.2 RAM的故障模型分析  27-29
    2.2.3 单粒子事件故障的模型  29-30
  2.3 单粒子事件故障注入模型  30-35
    2.3.1 FARM模型  30-31
    2.3.2 单粒子故障注入的模型  31-35
  2.4 本章小结  35-36
第3章 分布式软件故障注入方法  36-54
  3.1 引言  36
  3.2 故障注入领域中的一些定义和术语  36-38
  3.3 分布式系统  38-41
  3.4 单机故障注入与分布式系统故障注入的不同点  41-42
  3.5 分布式系统的故障模型  42-47
    3.5.1 故障模型  42-43
    3.5.2 内存故障模型  43
    3.5.3 CPU故障模型  43-44
    3.5.4 通讯故障模型  44-45
    3.5.5 软件故障模型  45-46
    3.5.6 故障模型的时间控制  46-47
  3.6 故障注入的底层机理  47-53
    3.6.1 Unix/Linux系统  47-48
    3.6.2 Solaris系统  48-49
    3.6.3 Windows系统  49-53
  3.7 本章小结  53-54
第4章 基于错误传播分析的软件脆弱点检测方法  54-66
  4.1 引言  54-55
  4.2 软件系统与环境模型  55-57
  4.3 错误传播特性  57-63
    4.3.1 信号级上的错误传播  57-60
    4.3.2 模块级上的错误传播  60-61
    4.3.3 识别软件脆弱点  61-63
  4.4 参数的实验估计方法  63-65
  4.5 本章小结  65-66
第5章 分布式故障注入仿真系统  66-79
  5.1 引言  66
  5.2 故障注入系统的总体设计  66-67
  5.3 故障注入系统各模块设计  67-69
  5.4 仿真实验  69-74
    5.4.1 分布式实验硬件系统  69-70
    5.4.2 实验内容  70-72
    5.4.3 故障注入与回收信息  72-74
  5.5 实验结果与分析  74-78
    5.5.1 注入器信息分析  74-77
    5.5.2 注入对象回收信息分析  77-78
  5.6 本章小结  78-79
结论  79-80
参考文献  80-85
攻读学位期间发表的学术论文  85-87
致谢  87

相似论文

  1. 面向软件的故障注入工具的研究与实现,TP311.52
  2. 一种可视化的分布式数据集成模型的研究与实现,TP311.52
  3. 构建分布式系统的关键技术研究与实现,TP338.8
  4. 基于GPRS的无线信息采集监控系统的研究与设计,TN929.5
  5. 一个分布式作战指挥仿真系统的设计与实现,TP311.52
  6. 基于Web Service在线考试管理系统的研究与实现,TP311.52
  7. 分布式动态交通信息挖掘及导航,TP311.13
  8. 分布式图像管理系统的设计与实现,TP311.52
  9. 分布式麦克风阵列跟踪算法研究,TN912.3
  10. 分布式系统性能测试与分析方法研究,TP311.52
  11. SRAM型FPGA单粒子故障传播特性与测试方法研究,V467
  12. P2P视频点播系统优化的研究与实现,TP393.09
  13. 分布式多视角目标跟踪的统计推理方法及实现,TP391.41
  14. CTCS-3级列控系统的UML建模与模型检验研究,TP273
  15. 基于B/S模式的制造企业物流管理系统设计与实现,TP311.52
  16. 无线WAP办公门户系统设计与实现,TP317.1
  17. 分布式图像融合系统研究与实现,TP391.41
  18. 计算机系统可信性评测研究与设计,TP311.52
  19. JavaEE轻量级框架在Web系统中的应用与实现,TP311.52
  20. 基于事件的分布式系统行为分析框架的设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 分布式计算机
© 2012 www.xueweilunwen.com