学位论文 > 优秀研究生学位论文题录展示

基于内容的视频检索研究与实现

作 者: 刘生贵
导 师: 陈建国
学 校: 四川大学
专 业: 光学
关键词: 多媒体技术 镜头边界检测 视频索引 视频结构化分析 视频内容分析 视频浏览 视频检索
分类号: TP391.3
类 型: 硕士论文
年 份: 2006年
下 载: 504次
引 用: 4次
阅 读: 论文下载
 

内容摘要


随着光电技术、计算机技术、网络技术和信息技术的迅速发展,海量多媒体信息的浏览和检索成为多媒体信息研究的热点。集图像、声音、文本于一体的视频信息是应用最多的一种多媒体信息,也是多媒体信息研究的重点之一。 在国内外众多研究者的努力下,以数字图像处理、数字视频处理为核心的视频检索技术取得了长足的进展。但是,高效、实用的视频检索技术研究和系统开发仍是人们面临的一项难题。 本文在回顾总结视频检索背景和相关工作的基础上,研究了视频检索中的视频镜头分割和视频结构索引两项关键技术,设计并实现了基于内容的视频检索系统。具体内容包括: 1.提出了一种新的镜头分割算法:基于机器学习的压缩域镜头分割。在视频数据中,编码生成的运动矢量、残差能量等差分预测信息可以很好的体现视频图像特征变化。结合MPEG编码的多尺度帧结构特性和差分预测特征,本文提出了压缩域中一种新的镜头分割算法,该方法的基本思路是:应用机器学习的方法在MPEG编码帧的多个尺度上学习差分预测特征的变化规律,以此为模板检测视频序列中的镜头边界,实现镜头边界的快速准确检测。实验表明,该方法在确保检测精度的情况下大大提高了检测效率。 2.进一步完善视频结构索引的机制:为了能够快速随机地访问视频数据,就需要为视频的结构信息建立索引。利用视频数据的编码结构信息和内容结构信息,文中实现了基于数据库的视频结构索引。基于数据库的视频结构索引解决了实时视频浏览和检索的问题。 3.视频检索系统的设计与实现:视频检索系统的实现是一项细致、复杂而又庞大的工程,其间涉及到许多关键技术,比如视频流的解析、视频信息的建模表示、浏览检索机制的建立等。视频信息的建模表示指视频数据的结构和内容信息的挖掘与描述,比如镜头分割、视频索引、视频图像的特征提取、字符检测识别、人脸检测识别、语音识别等。通过积累实验室多年来的研究成果和开发技术,本文设计并实现了一个功能全面、性能高效的

全文目录


摘要  3-5
Abstract  5-9
第一章 前言  9-13
  1.1 信息时代媒体信息技术的发展  9-11
  1.2 论文的研究目标与贡献  11-12
  1.3 论文的组织结构  12-13
第二章 视频检索背景与相关工作  13-31
  2.1 视频数据压缩标准-MPEG系列  13-20
    2.1.1 运动图像及其伴音编码国际标准MPEG-1  14-16
    2.1.2 高质量运动图像编码国际标准MPEG-2  16-17
    2.1.3 面向音视对象的编码标准MPEG-4  17-18
    2.1.4 多媒体内容描述接口MPEG-7  18-19
    2.1.5 多媒体框架MPEG-21  19-20
  2.2 基于内容的视频检索研究现状  20-29
    2.2.1 视频信息的建模表示  21-26
      2.2.1.1 视频结构信息建模  21-24
      2.2.1.2 底层特征信息建模  24-26
      2.2.1.3 高层语义特征建模  26
    2.2.2 国内外视频检索研究现状  26-29
      2.2.2.1 国外的视频检索研发现状  26-28
      2.2.2.2 国内的视频检索研发现状  28-29
  2.3 视频检索评测TRECVID  29-30
  2.4 本章小结  30-31
第三章 镜头边界检测与视频结构索引研究  31-53
  3.1 镜头边界检测技术研究  31-48
    3.1.1 镜头边界检测基本算法回顾  31-35
      3.1.1.1 非压缩域的镜头分割方法  31-33
      3.1.1.2 压缩域中镜头分割方法  33-35
    3.1.2 基于机器学习的压缩域镜头分割算法研究  35-48
      3.1.2.1 基本原理  35-38
      3.1.2.2 检测方法  38-43
      3.1.2.3 实验结果  43-48
      3.1.2.4 小结  48
  3.2 视频结构索引研究  48-52
    3.2.1 建立视频结构索引的必要性  48-49
    3.2.2 视频结构索引的机制  49-50
    3.2.3 索引信息的存储  50-52
      3.2.3.1 基于文件存储的方法  50-51
      3.2.3.2 基于数据库的方法  51-52
  3.3 本章小结  52-53
第四章 视频检索系统设计与实现  53-64
  4.1 系统的原理与框架  53-57
    4.1.1 系统的实现原理  53-56
    4.1.2 系统的实现框架  56-57
  4.2 系统的功能模块  57-62
    4.2.1 数据采集与解析  57-58
    4.2.2 视频信息建模表示  58-59
    4.2.3 视频内容的浏览检索  59-62
  4.3 系统涉及的关键技术  62-64
第五章 总结与展望  64-65
参考文献  65-70
附录 硕士期间发表的论文以及参加的研究和项目  70-71
致谢  71-73

相似论文

  1. 高中世界历史课堂教学中的多媒体技术运用探析,G633.51
  2. 沈阳电视台视频素材采编系统软件的设计与实现,TP311.52
  3. 经口鼻插管术并发症的教学设计与实践,R47-4
  4. 基于权重颜色分量和粒子群算法的视频检索方法的研究,TP391.41
  5. 基于压缩域特征的视频检索技术研究,TP391.41
  6. 视频镜头边界检测算法的研究,TP391.41
  7. 基于内容的县党政会议视频检索系统的实现,TP391.41
  8. 基于内容的视频检索关键技术的研究与实现,TP391.41
  9. 多媒体条件下的对外汉字教学,H195
  10. 基于视频镜头的苹果病斑检索研究,TP391.41
  11. 基于颜色和形状特征的视频检索研究,TP391.41
  12. 基于内容的新闻视频检索原型系统的设计与实现,TP391.41
  13. 基于H.264/AVC压缩域的视频镜头边界检测方法研究,TN919.8
  14. 基于内容的视频检索技术研究,TP391.41
  15. 基于卡方检测和宏块类型统计的视频镜头边界检测算法的研究,TP391.41
  16. 基于纹理的视频镜头边界检测系统研究,TP391.41
  17. 视频检索中的镜头边界检测算法研究,TP391.41
  18. 基于内容的视频情感提取算法研究,TP391.41
  19. 基于内容的视频检索方法的研究,TP391.41
  20. 基于内容的视频检索中镜头分割与关键帧提取研究,TP391.41
  21. 多媒体发布/订阅系统的设计与实现,TP393.09

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com