学位论文 > 优秀研究生学位论文题录展示

多机热备高可用集群的设计和研究

作 者: 晏伟
导 师: 张军;熊尚坤
学 校: 华南理工大学
专 业: 电子与通信工程
关键词: 高可用性 集群系统 热备份
分类号: TP311.5
类 型: 硕士论文
年 份: 2011年
下 载: 8次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息技术不断深入到人类生活和商业活动,企业和个人对于信息服务的依赖程度越来越高。人类无时无刻需要获取信息,然而关键行业敏感信息的丢失将带来极为严重的后果。如何保证信息基础设施全天候、高可靠、不间断地提供服务是摆在全球电信运营商、互联网信息提供商的一个现实课题。为了降低系统短时间内的停机故障而导致业务中断的风险,高可用集群技术作为一种廉价、高效的手段具有广阔的应用前景。本文的主要工作是讨论如何在多服务器集群系统中实现高可靠、不间断服务的要求,主要内容和成果如下:1.首先介绍了集群系统,特别是高可用性集群的基本概况。介绍了基于马尔可夫过程的n节点集群系统可用性模型。2.结合ATCA平台多服务器节点集群的特点,分析了一种N+1型高可用集群软件架构的设计和原理,讨论了该软件架构中各部分进程模块的作用、职责;重点完成了该软件架构的部分关键进程模块心跳检测、同步协作和调度修复机制的设计;论证了这种设计方案是如何通过进程间的相关保护以达到集群的高可用性要求。3.完成了这种N+1型的高可用集群软件中HAAgent、HAApp、ProcessMonitor等关键进程的开发和实现。最后,在ATCA平台上测试集群软件的性能数据,验证了这种N+1型高可用集群软件架构设计已经达到符合高可用集群的要求。

全文目录


摘要  5-6
Abstract  6-10
第一章 绪论  10-14
  1.1 概述  10-11
  1.2 研究现状  11-12
  1.3 研究内容  12
  1.4 本文章节安排  12-14
第二章 高可用集群系统概述  14-25
  2.1 集群系统  14-16
    2.1.1 集群系统的概念  14-15
    2.1.2 集群系统的分类  15
    2.1.3 集群系统的优点  15-16
  2.2 高可用集群  16-21
    2.2.1 高可用性概念  16-18
    2.2.2 高可用集群分类  18-20
    2.2.3 高可用集群的状态机  20-21
  2.3 基于马尔可夫过程分析研究集群系统可用性  21-24
  2.4 本章小结  24-25
第三章 高可用集群软件架构  25-37
  3.1 N+1 型高可用集群软件架构的介绍  25-30
    3.1.1 主控服务节点  26
    3.1.2 业务服务节点  26-27
    3.1.3 HA Server 进程  27-28
    3.1.4 HA Agent 进程  28
    3.1.5 HA API (HA App)进程  28-29
    3.1.6 Process Monitor 守护进程  29-30
  3.2 进程模块间的心跳检测策略的介绍  30-36
    3.2.1 HA Server Master 与HA Server Slave  30-32
    3.2.2 HA Server 与HA Agent  32-34
    3.2.3 HA Agent 与HA App  34-35
    3.2.4 HA Agent 与Process Monitor  35-36
  3.3 本章小结  36-37
第四章 服务节点高可用模块的设计和实现  37-64
  4.1 HA Server 的介绍  38-41
    4.1.1 进程的函数实现  38-39
    4.1.2 HA Server Master 故障的调度过程介绍  39-41
  4.2 HA Agent 的设计实现  41-50
    4.2.1 需求分析  42
    4.2.2 进程的函数实现  42
    4.2.3 启动流程  42-44
    4.2.4 HA Agent 与Process Monitor 的心跳检测  44-46
    4.2.5 处理HA App 故障的流程分析  46-48
    4.2.6 主备倒换的时序分析  48-50
  4.3 Process Monitor 的设计实现  50-56
    4.3.1 需求分析  50-51
    4.3.2 进程的函数实现  51
    4.3.3 启动流程  51-52
    4.3.4 处理HA Agent 故障的流程分析  52-54
    4.3.5 处理HA Agent 故障的时序分析  54-56
  4.4 HA API 的设计实现  56-63
    4.4.1 需求分析  56
    4.4.2 进程的函数实现  56-57
    4.4.3 App 进程注册的时序分析  57-59
    4.4.5 App 进程调度的时序分析  59-63
  4.5 本章小结  63-64
第五章 N+1 型的高可用集群系统性能测试  64-71
  5.1 测试环境  64-65
    5.1.1 ATCA 硬件架构简介  64-65
    5.1.2 软、硬件测试环境  65
  5.2 测试目的  65-66
  5.3 测试用例  66-67
  5.4 测试结果  67-69
  5.5 测试结果分析  69-70
  5.6 本章小结  70-71
结论  71-72
参考文献  72-75
攻读硕士学位期间取得的研究成果  75-76
致谢  76-77
附件  77

相似论文

  1. Linux集群环境下作业调度算法的研究与实现,TP301.6
  2. TCN网关MVB模块的设计与实现,TN915.852
  3. 宽带远程接入服务器高可靠冗余备份关键技术的研究,TP309.3
  4. 分布式交换机上MVRP协议的研究与实现,TP393.04
  5. 基于Exchange的中小企业邮件系统的研究与实现,TP393.098
  6. 不可否认机制与时间戳服务系统研究,TP393.08
  7. 高可用性软件测试的方法及应用,TP311.52
  8. 空间数据库集群中间件技术研究与实现,TP311.13
  9. IMS体系离线计费采集系统的研究与实现,TN915.09
  10. 基于GIDS的入侵检测集群技术研究,TP393.08
  11. 新闻类网站流量统计系统的设计,TP393.092
  12. 汽车行业MES系统数据保护研究,TP309.2
  13. 基于Linux的集群系统的应用研究,TP338
  14. 基于虚拟技术的数据中心建设研究,TP308
  15. 全IP架构复合移动通信系统的容错机制设计,TN929.5
  16. 基于双机热备的高可用性呼叫中心的设计与实现,TN99
  17. 跳频通信系统中同步技术的研究,TN914.41
  18. 行业应用网关集群架构的设计与实现,TN915.05
  19. 负载均衡在梦网业务中的网络设计和应用,TN929.5
  20. 旅游目的地旅游产业集群发展战略研究,F592

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程
© 2012 www.xueweilunwen.com