学位论文 > 优秀研究生学位论文题录展示

基于物体检测的场景分类方法研究

作 者: 谢守志
导 师: 张磊
学 校: 哈尔滨工程大学
专 业: 信号与信息处理
关键词: 场景分类 OB方法 Fisher判别 类内类间散布 O2C距离
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络和计算机技术的飞速发展,数字图像在人们的日常生活中占据着越来越重要的地位,如何高效地分类管理这些数字图像就变得非常有意义。传统的场景分类方法大多使用低层的图像特征,如颜色、纹理等。对于各种视觉识别任务,如目标识别和场景分类,这些鲁棒性的低层图像特征已经被证明是有效的图像表征。但是这些低层的图像特征几乎不包含语义信息,因此对于高层的视觉任务低层的图像表征就显得不是很充分。一种叫做目标库(Object Bank,OB)的高层图像表征包含了高层的语义信息,使其更适合高层的视觉识别任务。本文在研究OB方法的基础上,针对其一些缺陷进行了相应的改进。首先,针对OB方法使用了过高维数的特征向量这一缺点,提出了一种基于Fisher权重的改进方法。高维特征向量的使用大大影响OB方法的分类效率,而使用低维特征向量又会降低其分类的准确率。Fisher权重的改进方法对没有经过空间金字塔处理的OB方法中的低维特征向量加以Fisher权重,使得新得到的特征向量具有极大化类间数据差异并且极小化类内数据差异的性质。从而使其在提高分类准确率的同时,大大提高了分类的效率。其次,针对OB方法对不同物体对于分类的贡献作相同对待的缺点,提出了一种基于类内类间散布权重的改进方法。不同物体对于分类的贡献程度是不尽相同的,类内散布小类间散布大的物体更有利于分类,应该给予较大的权重;反之,则给予较小的权重。结果表明,本文提出的方法有效地提高了分类的性能。再次,提出一种基于高维空间坐标的高层图像表征方法。该方法首先利用K-means聚类算法计算得到不同类别的聚类中心,然后分别计算特征向量与不同聚类中心之间的距离,最后用这些距离替换原来的特征向量来表征图像。新得到的特征向量更直接的表征了其与各个类别之间的关系,从而更有利于分类。实验结果说明,该方法提高了分类的性能。最后,提出一种基于O2C距离的高层图像表征方法。与基于高维空间坐标的高层图像表征方法相比,该方法选取特征向量与不同聚类中心之间的距离的最小值作为O2C距离来表征图像,大大降低了特征向量的维数,从而提高了分类的效率。文章最后对本文方法的优劣行进行了详细的分析。

全文目录


摘要  5-6
ABSTRACT  6-10
第1章 绪论  10-17
  1.1 论文研究的目的和意义  10-11
  1.2 场景分类的研究现状  11-14
  1.3 场景分类技术面临的主要挑战  14-15
  1.4 论文主要研究内容和章节安排  15-17
第2章 基于物体检测的场景分类方法基本原理  17-30
  2.1 引言  17
  2.2 物体检测器的训练  17-25
    2.2.1 HOG 特征  17-19
    2.2.2 滤波器  19-20
    2.2.3 可变形部件模型  20-21
    2.2.4 混合模型  21-22
    2.2.5 模型的学习  22-25
  2.3 OB 方法中物体检测器的设置  25-27
  2.4 高层图像表征  27-29
    2.4.1 物体检测响应表征图像  27-28
    2.4.2 带有空间位置信息的图像表征  28-29
  2.5 本章小结  29-30
第3章 基于权重改进的 OB 方法  30-40
  3.1 OB 方法的缺点  30-31
  3.2 基于 Fisher 权重的改进方法  31-35
    3.2.1 Fisher 判别的基本原理  31-34
    3.2.2 Fisher 判别在 OB 方法中的应用  34-35
  3.3 基于类内类间散布权重的改进方法  35-39
    3.3.1 类内散布和类间散布  35-36
    3.3.2 类内散布和类间散布在 OB 方法中的应用  36-39
  3.4 本章小结  39-40
第4章 基于高维空间坐标的高层图像表征方法  40-47
  4.1 K-means 聚类算法  40-41
  4.2 高维空间坐标表征  41-44
    4.2.1 聚类中心  41-42
    4.2.2 特征向量的空间坐标定位  42-44
  4.3 基于 O2C 距离的高层图像表征方法  44-46
    4.3.1 图像到类别的距离(Image to Class Distance)  45
    4.3.2 物体到类别的距离(Object to Class Distance)  45-46
  4.4 本章小结  46-47
第5章 实验结果及分析  47-57
  5.1 实验环境简介  47
  5.2 性能评价标准  47-49
  5.3 实验结果与分析  49-56
    5.3.1 基于 Fisher 权重的改进方法实验结果  49-50
    5.3.2 基于类内类间散布权重的改进方法实验结果  50-51
    5.3.3 基于高维空间坐标的高层图像表征方法实验结果  51-54
    5.3.4 基于 O2C 距离的高层图像表征方法实验结果  54-55
    5.3.5 综合实验结果及分析  55-56
  5.4 本章小结  56-57
结论  57-58
参考文献  58-62
攻读硕士学位期间发表的论文和取得的科研成果  62-63
致谢  63

相似论文

  1. 苏州市中老年恶性肿瘤早期防治体系的建立与探讨,R730.1
  2. 基于扩展监督主题模型的高分辨率合成孔径雷达图像的分类与标注,TN957.52
  3. 单体建筑物震害快速评估研究,TU311.3
  4. 基于SIFT特征和SVM的场景分类,TP391.41
  5. 基于特征提取的视频场景分类技术研究,TP391.41
  6. 耐火砖内部缺陷检测方法研究与系统开发,TQ175.7
  7. 基于音频的网络广播电视实时分析系统,TN949.292
  8. 基于Contourlet变换和子空间分析的人脸识别技术研究,TP391.41
  9. 面向虚拟场景生成的视频素材库管理系统,TP391.41
  10. 基于概率潜在语义分析的图像场景分类,TP391.41
  11. 基于群体决策和证据理论的信息融合新方法及在多分类器集成中的应用,O212.8
  12. 多/高光谱遥感图像光谱分解研究与应用,TP751.2
  13. 对慢性乙型肝炎辨证分型的文献分析及肝郁脾虚型的Fisher判别分析,R259
  14. 基于多颜色空间的叠加原理和场景分类的研究,TP391.41
  15. Fisher和支持向量综合分类器,TP181
  16. 基于中层语义的图像场景分类算法研究,TP391.41
  17. 基于双目视觉的自然场景感知,TP391.41
  18. 基于人脸图像的性别识别技术研究,TP391.41
  19. 基于车辆声频信号的车型自动分类与识别,U495
  20. 基于脑电的意识任务特征提取与识别方法研究,TP391.41
  21. 人脸表情识别,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com