学位论文 > 优秀研究生学位论文题录展示

基于Hadoop的云转码系统研究及性能优化

作 者: 王利锋
导 师: 郑宏云
学 校: 北京交通大学
专 业: 通信与信息系统
关键词: 云计算 Hadoop 云转码 HDFS 负载均衡
分类号: TN919.81
类 型: 硕士论文
年 份: 2014年
下 载: 40次
引 用: 0次
阅 读: 论文下载
 

内容摘要


摘要:目前,视频流量已经成为互联网的主要流量,各种视频应用层出不穷,从数字高清电视到IPTV。互联网用户使用视频应用的终端也日益多样化,从PC到手机。然而,不同的网络视频平台和终端支持的视频内容和格式,如编码格式、分辨率、帧率等参数不尽相同。为了满足不同平台和用户的视频服务需求,往往需要对视频进行转码,即进行相应的编码格式、分辨率和帧率等格式转换。视频转码是一项非常耗时耗资源的工作,随着视频数量的急剧增长,传统的单机或者集中式转码已经不能满足人们对效率和质量的要求。而云计算通过集中、分配资源可以提供强大的计算能力,并且有良好的扩展性和较高的容错能力。所以可以将视频转码工作转移到云计算平台上。采用云平台进行视频转码,不仅可以承受海量视频数据的存储、转码需求,同时由于云计算本身具有的资源聚集特性,取用方便,费用低廉。在众多的云计算平台中,Hadoop由于其开源特性,是目前应用最为广泛的云计算平台。本论文首先设计和实现了基于Hadoop的云转码系统。该系统利用MapReduce分布式机制进行视频转码。系统包括代理服务器,视频转码模块,Cache模块三大组件。代理服务器负责处理用户的视频服务请求,视频转码模块负责视频处理工作,Cache模块负责管理原视频和转码后的视频文件。接着,论文对所实现的转码系统的性能进行了测试和分析。比较该系统与单机的视频转码性能,测试分析了分段数量和分段大小对系统转码性能的影响,分析了各个阶段在系统执行过程中所占的时间比例。在系统的执行过程中,视频文件需要进行多次对HDFS进行读写,当前HDFS读数据时副本选择策略是选择离客户端网络拓扑距离最近的节点,当热门副本集中在同一节点或者一个机架内时,用户就会对有限的资源进行激烈的竞争,造成该节点或者该机架的负载大大增加,从而影响整个集群的性能。为了克服该不足,论文提出了基于负载均衡的副本选择策略,使用线性加权法定量描述节点的负载量,选择负载量最轻的节点作为读取节点。仿真实验表明,改进的算法有效减少了副本传输时间,增加了HDFS集群的吞吐率。

全文目录


致谢  5-6
中文摘要  6-7
ABSTRACT  7-9
目录  9-12
1 引言  12-16
  1.1 论文背景  12-13
  1.2 国内外云转码研究现状  13-14
  1.3 本文的主要工作及组织结构  14-16
2 Hadoop平台及视频转码技术  16-30
  2.1 云计算概述  16-20
    2.1.1 云计算的概念  16-17
    2.1.2 云计算的关键技术  17-20
  2.2 Hadoop平台概述  20-27
    2.2.1 Hadoop基本架构  20-21
    2.2.2 HDFS架构  21-24
    2.2.3 MapReduce架构  24-27
  2.3 视频转码技术  27-29
    2.3.1 视频压缩标准  27-28
    2.3.2 视频压缩原理  28
    2.3.3 视频转码技术  28-29
  2.4 本章小结  29-30
3 基于Hadoop的云转码系统设计与实现  30-40
  3.1 系统整体架构  30-31
  3.2 代理服务器的设计  31
  3.3 视频转码模块设计  31-34
    3.3.1 视频分割  32-33
    3.3.2 视频转码  33-34
    3.3.3 视频合并  34
  3.4 Cache模块设计  34-35
  3.5 基于MapReduce的视频转码算法  35-39
    3.5.1 InputFormat实现  36-37
    3.5.2 Mapper实现  37-38
    3.5.3 Reducer实现  38-39
  3.6 本章小结  39-40
4 云转码系统性能分析  40-48
  4.1 系统原型  40-41
  4.2 云转码系统与单机转码性能对比  41-43
  4.3 影响系统转码性能的因素分析  43-47
    4.3.1 分段大小对转码性能的影响  43-45
    4.3.2 Slave数量对转码性能的影响  45-46
    4.3.3 系统执行转码过程中几个重要阶段所占时间分析  46-47
  4.4 本章小结  47-48
5 客户端读取HDFS文件性能优化  48-66
  5.1 客户端读取HDFS文件的流程  48-50
  5.2 HDFS中副本读取的选择策略  50-51
    5.2.1 副本放置策略  50-51
    5.2.2 副本读取的选择策略  51
  5.3 基于负载均衡的副本选择策略  51-58
    5.3.1 评价指标  52
    5.3.2 评价函数  52-53
    5.3.3 层次分析法(AHP)介绍  53-56
    5.3.4 使用层次分析法(AHP)确定权系数  56-58
  5.4 负载评价指标的获取  58-59
    5.4.1 CPU和内存使用率的获取  58-59
    5.4.2 网络带宽获取  59
    5.4.3 硬盘I/O负载率获取  59
  5.5 仿真实验及结果分析  59-65
    5.5.1 仿真实验介绍  60-62
    5.5.2 实验结果与分析  62-65
  5.6 本章小结  65-66
6 总结与展望  66-68
  6.1 总结  66
  6.2 展望  66-68
参考文献  68-71
附录A  71-75
附录B  75-77
作者简历  77-79
学位论文数据集  79

相似论文

  1. 云计算平台下的动态信任模型的研究,TP309
  2. 高校教务管理网上选课系统优化研究,TP393.09
  3. 基于Map/Reduce框架的分布式日志分析系统的研究及应用,TP311.52
  4. 基于Hadoop的在线购物原型系统的设计与实现,TP311.52
  5. 基于软件老化的负载均衡方法,TP311.52
  6. 基于Hadoop的移动学习系统设计与实现,G434
  7. 基于Google平台促销模块与商品模块的设计与实现,TP311.52
  8. 面向中小型商业银行的计算机集群技术分析与设计,TP338
  9. 基于HADOOP架构的社保项目网络日志分析系统的研究,TP311.52
  10. 基于MapReduce模型的eMTM三维人体模型生成引擎,TP391.41
  11. 基于云计算的软件资源服务平台研究,TP311.52
  12. 海量数据的快速查询算法研究,TP311.13
  13. 基于负载均衡的混合型应用层组播模型研究,TP393.02
  14. 高速网络环境下的入侵检测系统的研究,TP393.08
  15. 云计算平台上的增量学习研究,TP311.13
  16. 云队列:一个基于Hadoop的大规模消息基础平台,TP311.52
  17. 基于Hadoop的文本分类研究,TP391.1
  18. 基于Hadoop的分布式服务注册中心研究和实现,TP393.09
  19. 基于多核CPU的任务级数据处理研究及其在集群平台下的性能测试,TP274
  20. 基于Hadoop的视频转码系统设计与实现,TN919.81
  21. 云环境下MapReduce容错技术的研究,TP302.8

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com