学位论文 > 优秀研究生学位论文题录展示
基于语义的视频检索
作 者: 李德山
导 师: 李宗民
学 校: 中国石油大学
专 业: 计算机应用技术
关键词: 视频检索 语义对象 视觉注意力 语义提取模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 237次
引 用: 3次
阅 读: 论文下载
内容摘要
基于内容的视频检索(CBVR)是当前图像工程热点课题之一,它指根据视频的内容及上下文关系,对大规模视频数据库中的视频数据进行检索。可是人们习惯使用高层语义概念判断相似性,但是现有的视频内容检索大多是非语义层面的。由于低层特征和高层语义概念之间存在语义鸿沟,在语义概念层次进行视频内容的描述和操纵面临巨大的困难。如何跨越低层特征和高层语义概念之间的语义鸿沟,实现基于语义的视频检索,成为今天基于内容的视频检索(CBVR)的最大挑战。本文的主要研究内容和贡献如下:(1)对基于语义的视频检索的关键技术——视频语义的提取以及视频语义对象的提取进行了深入的研究,详述了目前已有的方法和算法,并从应用的角度分析了它们各自的优缺点。(2)提出了一种基于视觉注意力的时空联合的自动视频语义对象提取技术。这种方法是将人的视觉注意力引进进来,在时域和空域分别进行了视频语义对象的检测,最后利用动态融合技术进行时空联合,检测出视频语义对象。它对视频语义对象的检测是健壮和准确的,不但能够检测出时域视频运动语义对象,还能够检测出空域视频语义对象。实验验证此方法具有较高的性能和效率。(3)提出了一种多层次网络化视频语义提取模型。这个模型能够与我们上面提取的视频语义对象相适应,利用视频语义对象作为中间层,通过层次间的关联推理出高层视频语义概念,最终跨越低层特征与高层语义概念间的语义鸿沟。
|
全文目录
摘要 4-5 Abstract 5-9 第一章 前言 9-15 1.1 研究背景及意义 9-10 1.2 视频检索的研究现状 10-13 1.2.1 基于内容的视频检索 10-11 1.2.2 基于语义的视频检索 11-13 1.3 主要研究内容 13 1.4 论文组织结构 13-15 第二章 基于语义的视频检索技术 15-39 2.1 引言 15-16 2.2 基于语义的视频检索 16-19 2.2.1 基于语义的视频检索系统的总体架构 16-17 2.2.2 基于语义的视频检索系统关键问题及解决方法 17-19 2.3 视频语义提取方法 19-24 2.3.1 概率统计方法 19-22 2.3.2 统计学习方法 22-23 2.3.3 基于规则推理的方法 23-24 2.3.4 结合特定领域特点的方法 24 2.4 视频语义对象提取方法 24-38 2.4.1 基于时空联合的视频对象分割 25 2.4.2 基于光流场的视频对象分割 25-28 2.4.3 基于变换检测的视频对象分割 28-33 2.4.4 基于对象跟踪的视频对象分割 33-38 2.5 检索性能评估 38 2.6 小结 38-39 第三章 基于视觉注意力的视频语义对象提取 39-52 3.1 视觉注意力描述 39-40 3.2 方法框架 40-41 3.3 视频处理 41 3.4 运动语义对象检测模型 41-44 3.5 静态图像语义对象检测模型 44-48 3.5.1 特征提取 44-45 3.5.2 显著图 45-46 3.5.3 静态图像潜在语义对象确定 46-48 3.6 动态融合 48-49 3.7 仿真实验分析 49-51 3.8 小结 51-52 第四章 多层次网络化视频语义提取模型 52-55 4.1 模型框架 52-53 4.2 模型层次 53-54 4.3 小结 54-55 第五章 总结与展望 55-57 5.1 工作总结 55 5.2 工作展望 55-57 参考文献 57-61 致谢 61-62 攻读硕士学位期间取得的学术成果 62
|
相似论文
- 沈阳电视台视频素材采编系统软件的设计与实现,TP311.52
- 基于压缩域特征的视频检索技术研究,TP391.41
- 视频镜头边界检测算法的研究,TP391.41
- 视频检索技术及其在交通中的应用研究,TP391.41
- 基于内容的县党政会议视频检索系统的实现,TP391.41
- 基于内容的视频检索关键技术的研究与实现,TP391.41
- 面向字幕帧的视频图像文本识别,TP391.41
- 基于内容的视频语义提取软件研究及应用,TP391.41
- 高性能视频检索平台中网络性能优化设计与实现,TP393.09
- 基于视觉注意力和形状简化的抽象化绘制方法研究,TP391.41
- 基于内容的视频检索关键技术研究,TP391.41
- 基于H.264压缩域的视频检索研究,TP391.41
- 随机算法及信息论在基于内容的视频检索中的应用,TP391.41
- 基于关联图谱的视频片段检索,TP391.41
- 基于视频镜头的苹果病斑检索研究,TP391.41
- 基于可定位视频的实景导游系统设计与实现,F590.63
- 基于颜色和形状特征的视频检索研究,TP391.41
- 基于帧内编码地理信息视频系统的设计与实现,TP391.41
- 基于视觉注意力的信息隐藏方法研究,TP309
- 基于MPEG-7的视频数据库存储检索技术研究,TP391.41
- 基于脑电熵参数的视觉注意力分级研究,R338
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|