学位论文 > 优秀研究生学位论文题录展示

基于空间邻域词袋模型的图像标注技术

作 者: 常峰
导 师: 陶文兵
学 校: 华中科技大学
专 业: 计算机应用
关键词: 目标识别 条件随机场 上下文信息 图像分割 图切割 能量优化 词袋模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 42次
引 用: 0次
阅 读: 论文下载
 

内容摘要


图像目标自动识别标注是计算机视觉研究的一个重要问题,在最近几年得到了很大发展。如基于SIFT(Scale-invariant feature transform)关键点特征的词袋模型技术,在图像场景分类及目标识别标注中均得到了很好的应用。但是仍然存在很多问题,如尺度变换、光照变换、多视角变化、同种类别间的差异以及类别的增多等给识别标注造成了很大困难。针对传统的目标自动识别标注所存在的一些问题,在如下几个方面做出了一些创新性工作:1)基于用户先验的交互式目标提取的框架,将两类交互式图像分割问题拓展到多类情况。结合多层图模型,利用用户的初始画笔信息最优化全局能量函数,获得图像的分割结果。2)提出了基于字典的空间邻域特征,在描述图像特征时,考虑到词袋模型忽略了图像的空间结构关系,将图像的局部空间关系也融入到特征矢量中,改进了基于图像关键点的识别方法,并将此方法应用到场景分类中,取得了较好的识别结果。3)融合了基于多分割的图像预处理技术和区域邻域直方图统计信息,并结合条件随机场进行优化,研究如何利用图像分割指导目标识别问题,然后结合自顶向下和自底向上的学习方法,识别和定位图像中的目标。最后通过多个分类器的投票,来决策最终识别的结果。实现了自动图像标注系统和交互式目标提取系统,给定一幅图像,通过模式识别和机器学习等方法,自动的标注该图像中存在的目标及其位置,在一些主流数据集上达到了较高的识别率。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-15
  1.1 研究背景与意义  9-10
  1.2 国内外研究现状  10-13
  1.3 本文结构  13-15
2. 场景分类技术介绍  15-29
  2.1 场景分类引言  15-16
  2.2 词袋模型  16-18
  2.3 SIFT 尺度不变关键点  18-20
  2.4 视觉词汇表  20-22
  2.5 支持向量机学习  22-23
  2.6 基于用户先验的目标提取  23-27
  2.7 本章小结  27-29
3. 融合空间信息场景分类  29-39
  3.1 空间金字塔模型  29-33
  3.2 融合空间邻域信息场景分类算法  33-35
  3.3 实验结果  35-38
  3.4 本章小结  38-39
4. 融合邻域信息和多尺度分割的图像标注技术  39-54
  4.1 引言  39
  4.2 多分割模型  39-41
  4.3 融合相邻区域的特征信息  41-43
  4.4Graph Cut 介绍  43-45
  4.5 条件随机场对分类结果的优化  45-46
  4.6 实验结果  46-53
  4.7 本章总结  53-54
5 系统分析  54-57
  5.1 数据集的选取  54
  5.2 评价方法  54-55
  5.3 实验环境  55
  5.4 系统分析  55-56
  5.5 本章小结  56-57
6 总结与展望  57-59
  6.1 工作总结  57
  6.2 未来工作  57-59
致谢  59-60
参考文献  60-65
附录 1 攻读学位期间发表论文研究成果  65

相似论文

  1. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  2. 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
  3. 森林防火系统中图像识别算法的研究,TP391.41
  4. 红外超光谱图像的虚拟探测器研究,TP391.41
  5. 图像实时采集、存储与处理方法研究,TP391.41
  6. 数字图像处理在集装箱检测中的应用研究,TP274.4
  7. 个性化人工膝关节设计及其生物力学特性研究,R318.1
  8. 空中目标抗干扰识别跟踪系统,TN215
  9. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  10. 红外图像目标识别及跟踪技术研究,TP391.41
  11. 水下目标特征的压缩与融合技术研究,TN911.7
  12. 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
  13. 基于“词袋”模型的图像分类系统,TP391.41
  14. 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
  15. 基于知识的脊柱MRI影像分割算法研究,TP391.41
  16. 基于OpenCV的人脸检测方法研究,TP391.41
  17. 计算机辅助髋关节置换手术系统研究与开发,TP391.41
  18. SAR成像目标识别子区选取与匹配方法研究,TN957.52
  19. 基于能量优化的ZigBee关键技术的研究,TP212.9
  20. 基于单目夜视图像的深度估计,TP391.41
  21. 基于条件随机场的中文分词技术的研究与实现,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com