学位论文 > 优秀研究生学位论文题录展示

面向星载计算机瞬时故障的软件控制流错误检测技术

作 者: 李剑明
导 师: 谭庆平
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 面向硬件故障的软件容错 COTS器件 星载计算机 瞬时故障 控制流检测 故障注入
分类号: TP311.52
类 型: 硕士论文
年 份: 2009年
下 载: 104次
引 用: 8次
阅 读: 论文下载
 

内容摘要


随着空间探测活动的内容越来越丰富,星载计算机的作用也越来越重要。但是在空间环境中,硬件瞬时故障给星载计算机带来的可靠性问题非常突出。传统上一般采用专门的抗辐照器件来建造空间星载计算机。但是,抗辐照器件价格昂贵,难以供货且性能不高,而COTS(Commercial-Off-The-Shelf,商用现货)器件具有成本低、性能高的优势并且不受国外进口的限制,因此,可以用COTS来建造高性能星载计算机。然而,COTS器件本身的抗辐射能力有限,还需要用面向硬件的软件容错技术(SHIFT, Software Implemented Hardware Fault Tolerance)进行加固。面向硬件瞬时故障的软件容错技术一般是通过复制计算并比较结果的方法来检测发生在硬件中的瞬时故障,在编译的时候插入冗余计算的指令,可以简单高效的实现容错,所以容错编译成为面向硬件瞬时故障的软件容错中比较流行的一种实现方法。本文首先在深入分析了当前控制流检测技术原理及其优缺点的基础上,提出并实现了一种新的指令级控制流检测算法CFCPT(Control Flow Checking by Path Tracking)。该算法巧妙地采用两个变量同时对程序的执行路径进行跟踪,在保证检错能力的基础上,相对于传统上只采用一个变量对执行路径进行跟踪的算法,能获得更好的性能。然后,针对控制流检测算法RSCFC(Relationship Signatures for Control Flow Checking)中存在的最大基本块数受机器字长限制的问题,本文提出并实现了用分段的方式对结点标签进行设置的改进方法,该方法不仅保持了原算法的检错能力和性能,而且极大地改善了算法的现实可用性。最后,本文采用故障注入技术对算法的容错能力和性能进行验证,实验结果表明:CFCPT算法的平均错误覆盖率达到了98.8%,平均性能开销为60.5%;ERSCFC算法的平均错误覆盖率达到了98.7%,平均性能开销为59.3%。

全文目录


摘要  8-9
ABSTRACT  9-10
第一章 绪论  10-14
  1.1 课题背景  10-13
  1.2 课题主要研究内容及成果  13
  1.3 论文的组织结构  13-14
第二章 相关技术背景  14-31
  2.1 空间辐射对硬件系统的影响  14-15
  2.2 硬件容错技术  15-16
  2.3 硬件错误的软件检测技术  16-29
    2.3.1 软件实现的控制流错误检测技术  16-28
    2.3.2 软件实现的数据流错误检测技术  28-29
  2.4 错误恢复技术  29-30
    2.4.1 后向恢复技术  29-30
    2.4.2 前向恢复技术  30
  2.5 本章小结  30-31
第三章 基于路径跟踪的控制流检测算法CFCPT  31-39
  3.1 CFCPT 检错原理  31-32
  3.2 CFCPT 检错示例  32-35
  3.3 CFCPT 算法实现  35
  3.4 CFCPT 检错能力证明及性能分析  35-38
    3.4.1 CFCPT 检错能力证明  35-37
    3.4.2 CFCPT 性能分析  37-38
  3.5 本章小结  38-39
第四章 控制流检测算法RSCFC 的优化  39-55
  4.1 RSCFC 算法  39-40
    4.1.1 RSCFC 算法的基本块标签设置  39
    4.1.2 RSCFC 算法的检错原理  39-40
  4.2 RSCFC 改进  40-46
    4.2.1 改进思路  40-43
    4.2.2 进一步改进  43-46
    4.2.3 ERSCFC 与CFCPT 的性能比较  46
  4.3 ERSCFC 算法实现  46-49
  4.4 ERSCFC 的检错能力  49-50
  4.5 检错示例  50-53
  4.6 本章小结  53-55
第五章 故障注入实验  55-61
  5.1 实验环境及设计  55-56
  5.2 实验结果  56-57
  5.3 实验结果分析  57-60
  5.4 本章小结  60-61
第六章 结束语  61-63
致谢  63-64
参考文献  64-68
作者在学期间取得的学术成果  68-69
附录 基准程序的PISA 指令集汇编源码  69-76

相似论文

  1. 分布式系统的故障注入方法研究,TP338.8
  2. 面向软件的故障注入工具的研究与实现,TP311.52
  3. 施工隧道无线监控系统瞬时故障分析及控制技术研究,TP277
  4. SRAM型FPGA单粒子故障传播特性与测试方法研究,V467
  5. 片上网络可靠包传输算法研究,TN47
  6. CTCS-3级列控系统的UML建模与模型检验研究,TP273
  7. 计算机系统可信性评测研究与设计,TP311.52
  8. 高可靠星载双机备份系统的设计与评估,TP309.3
  9. 基于SCSI故障注入的可用性评测工具设计与实现,TP333
  10. 面向星载计算机的容错并行算法研究与实现,TP302.8
  11. 基于小波能量谱的超高压输电线路自适应单相重合闸技术的研究,TM762
  12. 面向安腾2处理器的故障注入工具设计与实现,TP332
  13. 一种容错计算机原型机的容错性能评测方法的研究与实现,TP302.8
  14. Linux操作系统内核可靠性评测方法研究,TP316.81
  15. 通讯故障注入测试系统的研究与实现,TP311.52
  16. 高端容错计算机故障注入工具的设计与实现,TP302.8
  17. 分布式文件系统容错能力测试平台的设计与实现,TP302.8
  18. 基于JTAG的CPU故障注入工具的设计与实现,TP332
  19. 基于CPCI总线的故障模拟系统的研究与实现,TP302.8
  20. EMP效应下计算机容错性能测试系统的研究与实现,TP302.8
  21. 软件故障注入及软件脆弱点检测方法研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com