学位论文 > 优秀研究生学位论文题录展示

基于MPEG-7低层特征的视频检索系统

作 者: 曾中魁
导 师: 郑烇
学 校: 中国科学技术大学
专 业: 控制理论与控制工程
关键词: MPEG-7 基于内容的视频检索 底层特征 视频片段 高维索引
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 90次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着数字技术与计算机网络的发展,视频数据量快速增长,如何组织和检索这巨大的视频信息成为一个难题。传统的基于文本来对视频信息进行检索的方法工作量巨大,而且文字标注缺乏统一的标准。因此,CBVR(基于内容的视频检索)技术被提出了,它的主要思想是根据视频图像所包含的颜色、纹理、形状以及对象的空间关系等底层特征和语义等高层特征来分析视频信息。但是,由于视频信息的信息量比一般图像/文本信息更为复杂更为庞大,其内容的描述缺乏统一标准,这就导致CBVR系统的通用性得不到保证从而限制了它的使用范围。而且视频图像的低级特征都是高维向量,对其进行检索非常困难,因此新的高维索引方式的提出是提高视频检索速率的关键。MPEG-7是运动图像专家组提出的基于内容的多媒体描述标准,它支持对视频内容的元数据和文本描述,提供了对视频内容的描述和检索规范。MPEG-7标准的逐步制定和完善,更加推动了高效的基于内容的多媒体信息检索系统的研究与开发。本文主要围绕MPEG-7颜色,纹理等底层特征来分析视频信息。首先从视频片段中抽取出关键帧,然后分析MPEG-7中的描述子提取算法,研究图像特征的提取方法,从视频关键帧中提取出图像的颜色、纹理、形状等描述子特征矢量,并将得到的特征值矢量保存在数据库中,将该特征矢量作为视频图像关键帧的签名,也就是以特征矢量来代表关键帧,这样我们在检索时可以计算两特征矢量的相似度来获得图像之间的相似度。由于关键帧的特征矢量都是高维矢量,如果在检索的时候采用顺序扫描的方式进行,检索速度将会令人难以接受。因此,我们研究了高维数据的索引算法,采用了BitMatrix算法对高维特征矢量数据库建立索引,该算法通过对高维矢量进行量化分区,当进行查询时,仅查询落在相同分区内的矢量数据,大大减少了相似度计算次数,有效地提高了检索效率。实验结果证明,本文所设计的视频检索系统检索速度远远超过顺序扫描算法,同时其检索精度也能满足查询要求,能够进行视频片段的检索。

全文目录


摘要  4-5
ABSTRACT  5-9
第1章 绪论  9-13
  1.1 问题的提出  9-10
  1.2 当前国内外研究现状  10-12
  1.3 论文主要工作  12
  1.4 论文组织结构  12-13
第2章 MPEG-7 标准简介  13-23
  2.1 MPEG-7 的范围  13-14
  2.2 MPEG-7 背景和应用  14-15
    2.2.1 MPEG 背景  14-15
    2.2.2 MPEG-7 应用  15
  2.3 MPEG-7 结构  15-18
    2.3.1 MPEG-7 组成部分  15-16
    2.3.2 MPEG-7 基本结构  16-18
    2.3.3 MPEG-7 可扩展性  18
  2.4 MPEG-7 概念模型  18-19
  2.5 MPEG-7 多媒体描述方案  19-21
    2.5.1 基本元素  19
    2.5.2 内容描述工具  19-20
    2.5.3 内容组织、浏览访问和用户交互  20
    2.5.4 分类方案  20-21
  2.6 小结  21-23
第3章 MPEG-7 视觉特征描述子  23-35
  3.1 颜色描述子  23-30
    3.1.1 颜色空间  23-26
    3.1.2 主颜色描述符  26
    3.1.3 可伸缩颜色描述符  26-27
    3.1.4 颜色结构描述子  27-29
    3.1.5 颜色量化  29
    3.1.6 颜色分布描述子  29
    3.1.7 帧组/图组描述子  29-30
  3.2 纹理描述子  30-32
    3.2.1 同构型纹理描述子  30-31
    3.2.2 纹理图像浏览描述子  31
    3.2.3 边缘直方图描述子  31-32
  3.3 形状描述子  32-34
    3.3.1 区域形状  32-33
    3.3.2 轮廓形状  33-34
    3.3.3 三维形状  34
  3.4 小结  34-35
第4章 BitMatrix 索引算法及其改进  35-55
  4.1 视频信息检索简介  35-38
    4.1.1 视频的表示方法  35-37
    4.1.2 视频片段相似度  37
    4.1.3 视频片段的检索方法  37-38
  4.2 高维索引技术介绍  38-45
    4.2.1 高维索引发展过程  38-40
    4.2.2 高维索引分类  40-42
    4.2.3 几种代表性的高维索引结构  42-45
  4.3 BitMatrix 视频索引算法  45-52
    4.3.1 BitMatrix 算法中的范围查询  47-48
    4.3.2 BitMatrix 算法中的相似度计算  48-49
    4.3.3 Bitmap 简介  49
    4.3.4 BitMatrix 算法具体步骤  49-52
  4.4 BitMatrix 算法的改进  52-54
    4.4.1 改进算法1  52-53
    4.4.2 改进算法2  53
    4.4.3 改进算法3  53-54
  4.5 小结  54-55
第5章 视频检索系统设计与实现  55-69
  5.1 系统总体模块  55
  5.2 MPEG-7 特征值抽取  55-58
    5.2.1 颜色分布描述子  56-57
    5.2.2 颜色结构  57
    5.2.3 边缘直方图  57-58
    5.2.4 区域形状描述子  58
  5.3 索引模块  58-61
    5.3.1 相似度度量  59-60
    5.3.2 索引  60-61
  5.4 查询模块  61-63
    5.4.1 样例特征值量化  61
    5.4.2 关键帧查询  61-62
    5.4.3 视频查询  62-63
  5.5 实验结果比较  63-68
    5.5.1 查询时间比较  64
    5.5.2 查询效果比较  64-68
  5.6 小结  68-69
第6章 总结与展望  69-71
  6.1 总结  69
  6.2 展望  69-71
参考文献  71-75
致谢  75-76
在读期间发表的学术论文与取得的其它研究  76

相似论文

  1. 高效三维视频表达及编码技术研究与开发,TN919.81
  2. 大规模图像检索中局部特征聚合与索引方法研究,TP391.3
  3. 嵌入式视频解码器运动补偿过程的数据布局优化,TN919.81
  4. 载姜黄素MPEG-P(CL-co-PDO)聚合物胶束的研究,R283
  5. 基于TILE Pro64多核处理器的3G服务器视频转码软件设计,TP393.05
  6. 时空融合的视觉选择注意模型及其在MPEG压缩域应用研究,TP391.41
  7. 基于广义组合多核高斯函数的图像分类方法研究,TP391.41
  8. 基于ASON的高速公路视频监控系统应用研究,TP277
  9. 基于压缩域特征的视频检索技术研究,TP391.41
  10. 视频镜头边界检测算法的研究,TP391.41
  11. 基于MPEG-4的运动目标检测技术研究,TP391.41
  12. 基于运动矢量的视频水印算法,TP309.7
  13. 基于内容的监控视频检索关键技术研究,TP391.41
  14. 基于本体的监控视频描述与检索研究及流媒体发布平台开发,TN919.8
  15. 基于音频词袋和MPEG-7特征的暴力视频快速分类算法研究,TP391.41
  16. 基于802.11网络的无线视频传输系统设计,TN919.8
  17. 基于MPEG-2标准的音视频同步实现,TN949.197
  18. 聚乙二醇化的VLA-4拮抗肽对哮喘小鼠气道上皮Eotaxin和CCR3表达的影响,R562.25
  19. 基于Web的煤矿视频监控系统的研究与开发,TP277
  20. 酒钢生产指挥中心数字监控系统的设计与实现,TP277
  21. 基于MPEG-2的视频数字水印的研究与实现,TP309.7

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com