学位论文 > 优秀研究生学位论文题录展示

一种容错计算机原型机的容错性能评测方法的研究与实现

作 者: 余晓燕
导 师: 吴智博
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 可用性 可靠性 故障注入
分类号: TP302.8
类 型: 硕士论文
年 份: 2010年
下 载: 37次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着面向银行等典型行业的支持事务处理、信息服务、金融计算应用的深入发展,对计算机系统的计算性能要求不断提高的同时,还要求其能够高速地、不间断地、实时处理各类事务处理任务。计算机系统的延误和失效可能会造成不可估量的损失。本系统在通常的系统中增加了一个仲裁处理器以保证系统不间断地运行,因此对本系统容错性能的评测具有十分重要的意义。计算机系统的容错性能通常可以从系统的可用性可靠性、可测性等几个方面来衡量,可用性和可靠性是最重要的两个方面。在可用性方面,本文采用为原型机系统建立可用性模型的方法来分析系统的可用性。在对系统的结构和特点进行了研究和分析的基础上,首先为系统建立了理想情况下的可用性模型,分析了各部件的失效率对系统可用性的影响,并计算了系统的可用度。然后又为系统建立了符合实际的可用性模型,重点分析了故障检测覆盖率与诊断和重构正确率对系统性能的影响,同时预计了系统的可用度。在可靠性方面,本文采用故障注入的方法实现对系统可靠性的评估。故障注入是评测容错机制的一种有效方法,通过人为产生故障并引入系统中,加速系统发生故障和失效的过程,利用对系统在注入故障后的反应信息的检测和分析,实现对容错系统容错性能的测试和评估。在研究了国内外对于计算机容错性能评测方法的基础上,选用了常见的通讯故障、内存故障、寄存器故障、PCI故障作为故障类型选择,设计并实现了用于评测原型机系统容错性能的故障注入工具。本文最后通过故障注入实验获得了评测容错系统容错性能的相关指标和有无仲裁处理器下的故障检测覆盖率与诊断和重构正确率两个重要参数,并使用这两个参数计算了系统有无仲裁处理器的可用度指标,从而得出了增加仲裁处理器后系统的可用度得到了提高的结论。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-17
  1.1 课题背景及研究意义  9-10
  1.2 容错系统  10-12
    1.2.1 容错概念  10-11
    1.2.2 系统容错设计  11-12
  1.3 故障注入技术  12-14
  1.4 国内外研究现状  14-15
  1.5 论文研究内容及结构  15-17
第2章 可靠性理论及马尔可夫模型基础  17-27
  2.1 引言  17
  2.2 可靠性理论概述  17-20
    2.2.1 可靠性及相关概念  17
    2.2.2 可靠性指标  17-20
  2.3 马尔可夫模型  20-25
    2.3.1 马尔可夫过程定义  20-22
    2.3.2 可修系统的马尔可夫一般模型  22-23
    2.3.3 马尔可夫模型的可靠性数学指标  23-25
  2.4 本章小结  25-27
第3章 原型机系统的可用性分析  27-43
  3.1 引言  27
  3.2 系统可靠性模型  27-30
    3.2.1 串联模型  27-28
    3.2.2 并联模型  28-29
    3.2.3 混联模型  29-30
  3.3 系统可靠性模型参数  30
  3.4 互备援系统可用性分析  30-35
  3.5 原型机系统理想情况可用性模型及分析  35-38
    3.5.1 原型机系统理想情况可用性模型  35-36
    3.5.2 原型机系统理想情况可用性分析  36-37
    3.5.3 原型机系统理想情况可用性计算  37-38
  3.6 原型机系统的可用性模型及分析  38-42
    3.6.1 原型机系统可用性模型  38
    3.6.2 原型机系统可用性分析  38-42
  3.7 本章小结  42-43
第4章 故障注入工具的实现  43-59
  4.1 引言  43
  4.2 故障、错误和失效  43-44
  4.3 故障模型的选择  44-45
    4.3.1 故障模型  44
    4.3.2 原型机系统的故障模型  44-45
  4.4 故障注入系统的总体设计  45-48
    4.4.1 故障注入系统的结构  45-46
    4.4.2 故障注入流程  46-47
    4.4.3 故障注入相关指标  47-48
  4.5 故障注入工具的实现  48-58
    4.5.1 通讯故障注入  48-52
    4.5.2 内存故障注入  52-54
    4.5.3 寄存器故障注入  54-55
    4.5.4 PCI 故障注入  55-58
  4.6 本章小结  58-59
第5章 原型机系统性能评估  59-65
  5.1 引言  59
  5.2 故障注入实验及结果  59-62
  5.3 原型机系统性能指标计算  62-63
  5.4 结果分析  63-64
  5.5 本章小结  64-65
结论  65-66
参考文献  66-70
致谢  70

相似论文

  1. 分布式系统的故障注入方法研究,TP338.8
  2. 面向软件的故障注入工具的研究与实现,TP311.52
  3. 低压电力线载波通信可靠性研究,TM73
  4. 用户权限管理系统可靠性测试的研究与应用,TP311.53
  5. 海底管道修复连接器的研究,TE973
  6. 分面元数据在网站检索系统中的应用研究,G354.2
  7. 矿井水文监测系统的可靠性技术研究及应用,TD742.1
  8. 躯体传感器网络自适应通信协议研究,TP212.9
  9. 定期检测的贮存系统的可靠性模型,O213.2
  10. 非晶硅薄膜晶体管在栅漏电应力下的退化研究,TN321.5
  11. 网络信息资源的可用性评价研究,G353.1
  12. 煤矿供电防越级跳闸保护系统的应用研究,TM732
  13. AODV在无线传感器网络中的改进与实现,TP212.9
  14. 岩体强度随机性与边坡可靠性研究,TD854.6
  15. 某多跨转子系统可靠性灵敏度分析,TH113
  16. 两级RAID高可靠分布式iSCSI网络存储系统,TP333
  17. 磁盘阵列级节能技术的研究与实现,TP333
  18. 基于谱分析法的LNG船疲劳可靠性分析,U661.4
  19. 数字化变电站系统可靠性及安全性研究,TM732
  20. DURO:一种针对RAID-6单盘失效在线重构方法的研究,TP333
  21. 多机热备高可用集群的设计和研究,TP311.5

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析 > 容错技术
© 2012 www.xueweilunwen.com