学位论文 > 优秀研究生学位论文题录展示
基于内容的视频检索研究与实现
作 者: 刘生贵
导 师: 陈建国
学 校: 四川大学
专 业: 光学
关键词: 多媒体技术 镜头边界检测 视频索引 视频结构化分析 视频内容分析 视频浏览 视频检索
分类号: TP391.3
类 型: 硕士论文
年 份: 2006年
下 载: 504次
引 用: 4次
阅 读: 论文下载
内容摘要
随着光电技术、计算机技术、网络技术和信息技术的迅速发展,海量多媒体信息的浏览和检索成为多媒体信息研究的热点。集图像、声音、文本于一体的视频信息是应用最多的一种多媒体信息,也是多媒体信息研究的重点之一。 在国内外众多研究者的努力下,以数字图像处理、数字视频处理为核心的视频检索技术取得了长足的进展。但是,高效、实用的视频检索技术研究和系统开发仍是人们面临的一项难题。 本文在回顾总结视频检索背景和相关工作的基础上,研究了视频检索中的视频镜头分割和视频结构索引两项关键技术,设计并实现了基于内容的视频检索系统。具体内容包括: 1.提出了一种新的镜头分割算法:基于机器学习的压缩域镜头分割。在视频数据中,编码生成的运动矢量、残差能量等差分预测信息可以很好的体现视频图像特征变化。结合MPEG编码的多尺度帧结构特性和差分预测特征,本文提出了压缩域中一种新的镜头分割算法,该方法的基本思路是:应用机器学习的方法在MPEG编码帧的多个尺度上学习差分预测特征的变化规律,以此为模板检测视频序列中的镜头边界,实现镜头边界的快速准确检测。实验表明,该方法在确保检测精度的情况下大大提高了检测效率。 2.进一步完善视频结构索引的机制:为了能够快速随机地访问视频数据,就需要为视频的结构信息建立索引。利用视频数据的编码结构信息和内容结构信息,文中实现了基于数据库的视频结构索引。基于数据库的视频结构索引解决了实时视频浏览和检索的问题。 3.视频检索系统的设计与实现:视频检索系统的实现是一项细致、复杂而又庞大的工程,其间涉及到许多关键技术,比如视频流的解析、视频信息的建模表示、浏览检索机制的建立等。视频信息的建模表示指视频数据的结构和内容信息的挖掘与描述,比如镜头分割、视频索引、视频图像的特征提取、字符检测识别、人脸检测识别、语音识别等。通过积累实验室多年来的研究成果和开发技术,本文设计并实现了一个功能全面、性能高效的
|
全文目录
摘要 3-5 Abstract 5-9 第一章 前言 9-13 1.1 信息时代媒体信息技术的发展 9-11 1.2 论文的研究目标与贡献 11-12 1.3 论文的组织结构 12-13 第二章 视频检索背景与相关工作 13-31 2.1 视频数据压缩标准-MPEG系列 13-20 2.1.1 运动图像及其伴音编码国际标准MPEG-1 14-16 2.1.2 高质量运动图像编码国际标准MPEG-2 16-17 2.1.3 面向音视对象的编码标准MPEG-4 17-18 2.1.4 多媒体内容描述接口MPEG-7 18-19 2.1.5 多媒体框架MPEG-21 19-20 2.2 基于内容的视频检索研究现状 20-29 2.2.1 视频信息的建模表示 21-26 2.2.1.1 视频结构信息建模 21-24 2.2.1.2 底层特征信息建模 24-26 2.2.1.3 高层语义特征建模 26 2.2.2 国内外视频检索研究现状 26-29 2.2.2.1 国外的视频检索研发现状 26-28 2.2.2.2 国内的视频检索研发现状 28-29 2.3 视频检索评测TRECVID 29-30 2.4 本章小结 30-31 第三章 镜头边界检测与视频结构索引研究 31-53 3.1 镜头边界检测技术研究 31-48 3.1.1 镜头边界检测基本算法回顾 31-35 3.1.1.1 非压缩域的镜头分割方法 31-33 3.1.1.2 压缩域中镜头分割方法 33-35 3.1.2 基于机器学习的压缩域镜头分割算法研究 35-48 3.1.2.1 基本原理 35-38 3.1.2.2 检测方法 38-43 3.1.2.3 实验结果 43-48 3.1.2.4 小结 48 3.2 视频结构索引研究 48-52 3.2.1 建立视频结构索引的必要性 48-49 3.2.2 视频结构索引的机制 49-50 3.2.3 索引信息的存储 50-52 3.2.3.1 基于文件存储的方法 50-51 3.2.3.2 基于数据库的方法 51-52 3.3 本章小结 52-53 第四章 视频检索系统设计与实现 53-64 4.1 系统的原理与框架 53-57 4.1.1 系统的实现原理 53-56 4.1.2 系统的实现框架 56-57 4.2 系统的功能模块 57-62 4.2.1 数据采集与解析 57-58 4.2.2 视频信息建模表示 58-59 4.2.3 视频内容的浏览检索 59-62 4.3 系统涉及的关键技术 62-64 第五章 总结与展望 64-65 参考文献 65-70 附录 硕士期间发表的论文以及参加的研究和项目 70-71 致谢 71-73
|
相似论文
- 高中世界历史课堂教学中的多媒体技术运用探析,G633.51
- 沈阳电视台视频素材采编系统软件的设计与实现,TP311.52
- 经口鼻插管术并发症的教学设计与实践,R47-4
- 基于权重颜色分量和粒子群算法的视频检索方法的研究,TP391.41
- 基于压缩域特征的视频检索技术研究,TP391.41
- 视频镜头边界检测算法的研究,TP391.41
- 基于内容的县党政会议视频检索系统的实现,TP391.41
- 基于内容的视频检索关键技术的研究与实现,TP391.41
- 多媒体条件下的对外汉字教学,H195
- 基于视频镜头的苹果病斑检索研究,TP391.41
- 基于颜色和形状特征的视频检索研究,TP391.41
- 基于内容的新闻视频检索原型系统的设计与实现,TP391.41
- 基于H.264/AVC压缩域的视频镜头边界检测方法研究,TN919.8
- 基于内容的视频检索技术研究,TP391.41
- 基于卡方检测和宏块类型统计的视频镜头边界检测算法的研究,TP391.41
- 基于纹理的视频镜头边界检测系统研究,TP391.41
- 视频检索中的镜头边界检测算法研究,TP391.41
- 基于内容的视频情感提取算法研究,TP391.41
- 基于内容的视频检索方法的研究,TP391.41
- 基于内容的视频检索中镜头分割与关键帧提取研究,TP391.41
- 多媒体发布/订阅系统的设计与实现,TP393.09
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|