学位论文 > 优秀研究生学位论文题录展示
视频搜索及语义提取
作 者: 南晓明
导 师: 蔡安妮
学 校: 北京邮电大学
专 业: 通信与信息系统
关键词: 基于语义的视频搜索 高层语义特征 低层视觉特征 决策级融合算法 TRECVID
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 143次
引 用: 1次
阅 读: 论文下载
内容摘要
伴随着网络和多媒体技术的发展,视频信息急剧膨胀。如何对海量的视频信息进行有效地检索和查询,已经成为目前迫切需要解决的问题。因此,基于内容的视频检索(Content-Based Video Retrieval, CBVR)技术受到广泛关注。本文分别从低层视觉特征提取、高层语义特征提取以及语义视频搜索三个层次就基于内容的视频检索进行研究,提出了一些新的算法和框架,主要内容如下:在低层视觉特征的选择和提取方面,全面分析和比较了基于关键点、纹理、边缘和颜色信息的四大类视觉特征在概念检测中的性能。首先采用基于Bag-of-Visual-Words的关键点投影算法,有效地量化高维关键点特征;其次改进了采用不同检测子的SIFT、SURF特征进行特征级融合的方法,最后在TRECVID数据集上,测试了不同视觉特征的检测性能。实验结果显示,经过融合后的SIFT、SURF特征较融合前原始特征的性能有显著提高。在高层语义特征的提取方面,提出了一种视频语义概念的提取框架。使用颜色、Gabor小波、边缘直方图和SIFT四种视觉特征,为每种视觉特征训练支持向量机作为分类器,经过分类器的决策级融合后,得到概念检测结果。随后提出了多种决策级融合算法,并在自测实验中进行测试。实验结果表明,混合各概念最佳融合算法构成的混合融合算法,对性能提高最大。TRECVID 2008高层特征提取的评测结果显示,本系统的整体性能高于所有参赛队伍的平均值。在视频搜索方面,提出了基于语义的视频搜索框架。分析了基于示例样本的搜索方式和基于语义概念的搜索方式,并分别采用基于语义相似性的方法和基于样本相关性的方法建立概念与语义查询的映射关系,实现了语义信息的自动提取,完成用户查询请求。在TRECVID 2009自动视频搜索评测中排名第一,充分验证了本文算法的有效性。
|
全文目录
摘要 4-6 ABSTRACT 6-8 目录 8-10 第一章 绪论 10-18 1.1 课题研究背景和意义 10-11 1.2 视频检索关键技术及研究现状 11-16 1.2.1 视频检索关键技术 11-14 1.2.2 视频检索技术研究现状 14-16 1.3 TRECVID 16 1.4 本文的工作与安排 16-18 1.4.1 主要研究内容 16-17 1.4.2 论文的结构安排 17-18 第二章 低层视觉特征的提取与性能分析 18-37 2.1 引言 18 2.2 本文提取的视觉特征 18-28 2.2.1 基于关键点的特征 18-22 2.2.2 基于纹理信息的特征 22-24 2.2.3 基于边缘信息的特征 24-27 2.2.4 基于颜色信息的特征 27-28 2.3 视觉特征处理方法 28-31 2.3.1 基于Bag-of-Visual-Words的关键点投影算法 28-29 2.3.2 特征的归一化 29-30 2.3.3 特征级的数据融合 30-31 2.4 实验结果及分析 31-36 2.4.1 实验系统框架 31-32 2.4.2 实验数据 32-34 2.4.3 实验结果比较及分析 34-36 2.5 本章小结 36-37 第三章 高层语义特征提取 37-50 3.1 引言 37 3.2 高层语义特征提取任务概述 37-39 3.3 高层语义特征提取系统框架 39-41 3.4 高层语义特征提取关键技术 41-46 3.4.1 视频数据标注 41 3.4.2 低层视觉特征 41-42 3.4.3 分类器训练 42-43 3.4.4 决策级融合算法 43-46 3.5 实验结果及分析 46-49 3.5.1 自测实验 46-48 3.5.2 TRECVID评测 48-49 3.6 本章小结 49-50 第四章 基于语义的视频搜索 50-61 4.1 引言 50 4.2 视频搜索任务介绍 50-52 4.3 基于语义视频搜索系统框架 52-53 4.4 基于语义视频搜索关键技术 53-57 4.4.1 查询预处理及分析 53-54 4.4.2 基于示例样本的搜索 54-55 4.4.3 基于语义概念的搜索 55-57 4.5 实验结果及分析 57-60 4.6 本章小结 60-61 第五章 总结与展望 61-63 5.1 论文总结 61-62 5.2 工作展望 62-63 参考文献 63-66 致谢 66-67 作者攻读硕士学位期间发表的学术论文 67
|
相似论文
- 融合进高层语义特征的医学图像检索技术研究,TP391.3
- 视频监控中基于人的检测与跟踪,TP277
- 基于内容的同源视频检索技术研究,TP391.41
- 基于多特征融合的视频高层语义概念检测,TP391.41
- 多模态视频信息检索,TP391.3
- 视像高层特征抽取算法研究,TP391.41
- 基于内容的视频分析关键技术,TP391.41
- 基于梯度和相位信息的低层视觉特征检测技术研究,TP391.41
- 基于文本和视觉信息融合的Web图像检索,TP391.3
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 基于FPGA的高速图像预处理技术的研究,TP391.41
- 2D人脸模板保护算法研究,TP391.41
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 图像拼接技术研究,TP391.41
- 高效精确字符串匹配算法的研究与实现,TP391.41
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 舌体特征的提取及融合分类方法研究,TP391.41
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
- 空中目标与背景的红外图像仿真技术研究,TP391.41
- 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|