学位论文 > 优秀研究生学位论文题录展示

大规模数据中心监控系统的设计与实现

作 者: 郑伟
导 师: 程耀东; 石京燕
学 校:
专 业: 计算机技术
关键词: 大规模监控 信息采集 分布式 Nagios 插件 高可用性
分类号: TP277
类 型: 硕士论文
年 份: 2013年
下 载: 3次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着我国国民经济的持续发展带动了科研信息化和社会信息化的高速增长。国内数据中心的数量不断增加,规模不断扩大。传统的IT基础设施管理水平和运维技术逐渐难以应对不断扩展的网络环境和不断增长的应用需求。在高能所数据中心环境中,面对服务器和网络设备大规模增长,分中心正在建设规划,现有单一需求的网络设备及服务器监控系统其准确性、扩展性和灵活性已经不能满足当前的需求。因此,管理员需要一个能够完成对大规模网络设备、服务器、系统服务的集中统一监控系统,该系统要具有很高的实时性、有效性与可扩展性,能够具有长年提供24小时监控和报警通知的能力。本文主要工作如下:1)根据需求分析,对现有三个开源监控系统Ganglia、Cacti、Nagios比较分析。研究Nagios在框架上设计的优势和应用上的一些不足。确定采用Nagios的框架结构设计,并针对其结构和功能上的不足,进一步设计和开发,提供一个大规模数据中心监控系统。2)实现系统总体结构设计,完成对监控对象的定义,确定调度管理策略,实现插件的定制开发,完成数据采集,对数据存储结构进行格式转化用于图形显示开发,实现基于WEB的配置管理设计,实现权限设置策略,开发报警插件实现具体报警功能,完成分布式的结构设计与实现。3)基于系统需求和特点,使用开源软件实现高可用性设计。4)通过规划和部署,使该系统应用到数据中心实际环境中,并进行优化和提高安全性。

全文目录


摘要  5-6
Abstract  6-7
目录  7-10
第一章 绪论  10-14
  1.1 研究背景与意义  10
  1.2 监控系统的研究现状与发展趋势  10-12
    1.2.1 商用监控系统研究现状  11
    1.2.2 开源监控系统研究现状  11-12
    1.2.3 监控系统的发展趋势  12
  1.3 本文主要研究内容  12-14
第二章 大规模数据中心监控系统相关技术  14-24
  2.1 监控系统体系结构  14-15
    2.1.1 集中式体系结构  14
    2.1.2 分布式体系结构  14-15
  2.2 Nagios开源监控系统  15-18
    2.2.1 主要监控功能  15-16
    2.2.2 Nagios框架结构  16-17
    2.2.3 Nagios与Ganglia、Cacti比较  17-18
  2.3 监控相关技术  18-23
    2.3.1 SNMP简单网络协议  18-19
    2.3.2 监控主动模式与被动模式  19-20
    2.3.3 Agent-less与Agent-based  20-22
    2.3.4 监控插件  22-23
  2.4 小结  23-24
第三章 系统设计与实现  24-44
  3.1 系统总体需求分析  24
  3.2 系统总体结构设计  24-26
  3.3 系统功能的设计与实现  26-40
    3.3.1 对象定义  26-27
    3.3.2 调度管理  27-28
    3.3.3 插件实现  28-30
    3.3.4 数据采集  30-32
    3.3.5 数据存储  32-33
    3.3.6 数据展示  33-35
    3.3.7 配置管理  35-37
    3.3.8 权限管理  37-38
    3.3.9 报警通知  38-40
  3.4 分布式结构的设计与实现  40-42
    3.4.1 分布式监控需求  40
    3.4.2 分布式监控架构设计  40-41
    3.4.3 分布式监控系统的实现  41-42
  3.5 小结  42-44
第四章 高可用性的设计与实现  44-50
  4.1 高可用相关技术介绍  44-45
  4.2 大规模数据中心监控系统的高可用性需求与设计  45-46
  4.3 大规模数据中心监控系统的高可用性具体实现  46-49
    4.3.1 heartbeat实现双机资源切换功能  46-47
    4.3.2 Rsync与Inotify实现配置实时同步  47-48
    4.3.3 高可用性效果验证  48-49
  4.4 小结  49-50
第五章 大规模数据中心监控系统实际部署与应用  50-54
  5.1 总体规划与部署  50-51
  5.2 系统优化策略  51-52
  5.3 系统安全性  52
  5.4 小结  52-54
第六章 总结与展望  54-58
  6.1 工作总结  54-55
  6.2 下一步的工作展望  55-58
参考文献  58-60
致谢  60-62
个人简历  62

相似论文

  1. Ad-Hoc网络多信道MAC层协议的信道分配问题的研究,TN929.5
  2. 分布式系统的故障注入方法研究,TP338.8
  3. 并行分布式网络模拟器PDNS容错技术的研究,TP302.8
  4. 面向海量邮件的检索系统研究与实现,TP393.098
  5. 基于比对技术的非法网站探测系统的实现与研究,TP393.08
  6. 基于嵌入式的面向造纸企业的一种QCS研究与设计,TP368.1
  7. 基于移动Agent的分布式网络通信机制的研究,TP393.02
  8. 分布式多视点视频编码容错边信息与相关噪声模型研究,TN919.81
  9. 多协议异构分布系统组网通信技术研究,TP273
  10. 基于Map/Reduce框架的分布式日志分析系统的研究及应用,TP311.52
  11. 连锁企业信息管理系统加密技术的设计与实现,TP393.08
  12. 基于特征分析的DDoS攻击检测技术研究,TP393.08
  13. 分布式审计系统中消息广播和超大数据传输方法的研究,TP338.8
  14. 基于OPC规范的疏干水源分布式远程监控系统,TP277
  15. 医院污水处理分布式控制的研究与设计,X799.5
  16. 分布式生物柴油生产工艺及装置的研究与开发,TE667
  17. 含分布式电源的配电网无功优化偿研究,TM714.3
  18. 分布式视频编码边信息生成研究,TN919.81
  19. 分布式认证跳表及其在P2P分布式存储系统中的应用,TP333
  20. 面向中小型商业银行的计算机集群技术分析与设计,TP338
  21. 战场多传感器管理系统研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化技术及设备 > 自动化系统 > 监视、报警、故障诊断系统
© 2012 www.xueweilunwen.com