学位论文 > 优秀研究生学位论文题录展示

基于视觉特性的视频编码技术研究

作 者: 张二丽
导 师: 赵德斌
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: HVS Foveation 内容自适应 运动关注 多关注点
分类号: TN919.81
类 型: 硕士论文
年 份: 2008年
下 载: 72次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息化时代的到来,人类也随之进入了一个崭新的网络多媒体时代,作为诸多计算机研究中最为活跃领域之一的多媒体视频编码技术也随着应用要求的改变而不断发展着。近年来,图像和视频压缩取得了很大的进步。然而,图像和视频信息的最终接受者是人,而现今的图像和视频压缩大都是基于像素间的统计冗余的,忽视了知觉上的冗余信息。从本质上说,压缩机制和视觉系统面临着一个相似的问题:怎样以一种高效的方式来描述视觉对象。如果能在压缩系统中采用某种视觉技术来达到获取较低码率和较高视觉质量的目的,是很有意义的。为此,本文对人眼视觉系统的视觉特性进行了研究,提出了基于人眼亮度适应性,时空域掩藏效应等特性的视频压缩方法。视频压缩中,由于人眼实际得到的是解压缩后的图像,因此对重建图像质量的评价是人们非常关心的问题。本文在总结了各种视频质量评测方法的基础上,对基于结构失真的视频质量评测方法SSIM进行了分析和实现,并采用该方法对本文提出的视频压缩方法进行性能评测。人眼的视锥细胞和神经细胞的分配是高度不均匀的,在小凹处密度很高,而周边区域的细胞密度则下降很快。因此HVS对视频图像的分辨率也是高度不均匀的。结合人眼的这种特性,本文对基于小凹的视频编码模型进行了研究,并在此基础上提出了基于内容自适应foveation模型的视频编码方法。在假设关注点在视频图像中心的情况下,根据视频序列的内容对该视频不同区域的分辨率进行调整。实验结果表明,该方法能够获得较好的压缩效率。考虑到观察者在观察视频图像的时候,其关注区域是在不断变化的,并且不同的观察者,其关注区域也是不同的。因此,本文结合运动关注模型给出了基于多关注点的视频压缩方法。在获取了视频帧运动矢量场之后,利用运动矢量强度和运动矢量方向的一致性对视频中的关注区域进行度量。然后根据该度量值,选取用于foveation编码的多个关注点。实验结果表明,该方法能够获得与人工标定关注区域获取相似的结果。

全文目录


摘要  3-4
Abstract  4-9
第1章 绪论  9-20
  1.1 课题的研究意义和背景  9-10
  1.2 视频压缩的发展及现状  10-15
    1.2.1 空间冗余及其消除  10-11
    1.2.2 时间冗余及其消除  11-12
    1.2.3 信息熵冗余及其消除  12-13
    1.2.4 视觉冗余  13-14
    1.2.5 知识冗余  14
    1.2.6 结构冗余  14-15
  1.3 AVS 视频技术概述  15-18
  1.4 本文主要研究内容及论文组织  18-20
第2章 基于视觉的视频编码的研究  20-31
  2.1 基于视觉的视频压缩的相关研究  20-23
    2.1.1 基于分析与合成的视频编码  21
    2.1.2 基于HVS 评价准则的编码  21-23
    2.1.3 分辨率自适应的视频编码  23
  2.2 HVS 特性研究  23-27
    2.2.1 人眼的亮度自适应性  23-24
    2.2.2 对比敏感度函数  24-25
    2.2.3 多通道特性  25-26
    2.2.4 掩藏和促进效应  26
    2.2.5 中央凹及周边视力  26-27
  2.3 基于HVS 特性的视觉模型的研究  27-28
  2.4 人眼的信息处理机制和感知模型  28-30
  2.5 本章小结  30-31
第3章 基于视觉的视频质量的评测  31-42
  3.1 传统的视频质量评测方法分析  31-32
  3.2 基于视觉的视频质量的评测  32-35
    3.2.1 基于视觉的视频质量主观评价  32-34
    3.2.2 基于视觉的视频质量客观评价  34-35
  3.3 常用的基于视觉感知的质量评测方法  35-40
    3.3.1 MOS  35-37
    3.3.2 基于结构失真的质量评测准则  37-40
  3.4 本章小结  40-42
第4章 基于内容自适应Foveation 模型的研究  42-62
  4.1 刚能鉴别的失真模型  42-45
    4.1.1 空间域的JND 版本  42-44
    4.1.2 时空域的JND 模型  44-45
  4.2 基于注意的视觉模型  45-50
    4.2.1 Foveation 视觉模型  45-48
    4.2.2 Foveation 视觉模型的应用  48-50
  4.3 内容自适应的Foveation 模型  50-55
    4.3.1 内容自适应的foveation 模型  51-52
    4.3.2 内容自适应Foveation 模型的实现  52-54
    4.3.3 基于内容自适应Foveation 模型的视频编码算法  54-55
  4.4 实验结果及分析  55-61
  4.5 本章小结  61-62
第5章 基于动态注意的foveation 模型  62-72
  5.1 现有注意力模型的分析  62-64
    5.1.1 视觉注意力机制  62-63
    5.1.2 视觉注意力模型特征  63-64
  5.2 适合于Foveation 编码的动态注意力模型的设计  64-67
    5.2.1 运动关注模型的设计  65-67
    5.2.2 运动关注模型的实现  67
  5.3 基于多关注点foveation 模型的视频编码算法  67-68
  5.4 实验结果及分析  68-69
  5.5 本章小结  69-72
结论  72-74
参考文献  74-79
攻读学位期间发表的学术论文  79-81
致谢  81

相似论文

  1. 基于视觉特性与图像模型的增强算法与性能分析,TP391.41
  2. 路面加速加载试验设备装配与使用技术,U416.03
  3. 基于视觉特性及人工神经网络的图像压缩,TP391.41
  4. 基于内容自适应的数字图像修复算法研究,TP391.41
  5. 基于时空域的视频去噪算法研究,TP391.41
  6. 结合人眼视觉特性和TV模型的图像去噪方法研究,TP391.41
  7. 非线性滤波soft tempest技术研究,TP391.41
  8. 基于调色板图像的信息隐藏算法研究与实践,TP309.7
  9. 基于图像空间多通道相似分解的图像质量综合评价方法,TP391.41
  10. 基于人眼视觉感知的增强显示模拟,TP391.41
  11. 一种结合HVS的大容量密写方法研究,TP391.41
  12. 基于HVS和熵分析的盲测量去块效应算法研究,TN919.81
  13. 人眼对比度敏感函数在图像感知中应用研究,TP391.41
  14. 基于图像的数字密写技术研究,TN918.4
  15. 基于FOVEA框架的视觉编码技术的研究,TP391.41
  16. 视频编码中数字水印算法的研究,TP309.7
  17. 基于HVS和SVR的小波域彩色图像自适应数字水印算法,TP391.41
  18. 基于误差扩散的数字半色调技术的研究,TP391.41
  19. 基于AQIM的数字图像水印技术的研究,TP309.7
  20. 基于机器学习的数字视频水印关键技术研究,TP309.7

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com