学位论文 > 优秀研究生学位论文题录展示

基于随机投影的场景文本图像聚类方法研究

作 者: 徐飞
导 师: 刘家锋
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 图像聚类 图像文本区域 局部特征描述 SIFT Affine-SIFT 随机投影
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 95次
引 用: 0次
阅 读: 论文下载
 

内容摘要


自然场景图像中的文本字符是描述和认知场景内容的关键线索,对场景视觉信息的表达和理解具有重要价值。由于场景图像中的文本字符存在于复杂的背景之中,拍摄视角的不同使得文本具有较大的几何变形,再加上存在光照变化、字符颜色不统一等,使用传统分割识别方法具有一定的局限性。本文对场景图像背景分离与字符识别的技术难点问题开展了深入的研究。鉴于文本区域的特殊性,颜色、纹理等全局特征的描述能力较弱,提出了使用SIFT和Affine-SIFT两种局部特征描述方式对图像进行特征抽取。由于使用以上两种方法得到的特征点数量太多,对后期处理的效率有很大影响,本文在SIFT算法中使用主方向与辅方向结合的特征挑选方法对特征点进行筛选,对Affine-SIFT算法采用图像自匹配的方法进行有效特征提取。由于图像不同,使得检测到的特征点数量也不同,无法直接通过特征点集评价图像间的相似程度,本文提出了一种基于随机投影的特征映射方法。该方法将图像的局部描述特征点作为输入,得到单个图像的特征矢量,保证了图像间相似性度量的可行性,与特征点匹配的方法相比,该方法效率更快。本文根据不同的数据集使用K-means和Affine propagation两种方法对图像进行聚类,并进行了对比实验。实验结果表明,本文方法可以对包含文字的自然场景图像有效地进行聚类,准确率能达到86.66%。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-17
  1.1 课题背景及研究的目的和意义  8-10
  1.2 课题相关领域研究现状及分析  10-15
  1.3 本文的研究内容及结构安排  15-17
第2章 局部特征描述随机投影理论  17-34
  2.1 引言  17-18
  2.2 本文采用的局部特征描述方法  18-28
    2.2.1 SIFT 方法介绍  18-24
    2.2.2 ASIFT (Affine-SIFT)  24-28
  2.3 随机投影理论基础  28-33
    2.3.1 随机森林可行性证明  28-31
    2.3.2 随机投影森林工作机制及其优越性  31-32
    2.3.3 随机投影算法应用到场景文本图像聚类的优势及应用  32-33
  2.4 本章小节  33-34
第3章 基于随机投影的图像聚类算法  34-48
  3.1 引言  34-35
  3.2 基于随机投影的图像聚类算法流程及实现  35-47
    3.2.1 学习随机投影森林  37-40
    3.2.2 获取图像的特征向量  40-41
    3.2.3 场景文本图像的聚类分析  41-47
  3.3 本章小结  47-48
第4章 实验结果及分析  48-56
  4.1 引言  48
  4.2 实验参数说明  48
  4.3 实验对比  48-53
  4.4 聚类结果图示  53-55
  4.5 本章小结  55-56
结论  56-58
参考文献  58-63
攻读学位期间发表的学术论文  63-65
致谢  65

相似论文

  1. 抗几何攻击的彩色图像数字水印算法研究,TP309.7
  2. 非稳定背景下的运动目标检测与鲁棒跟踪方法研究,TP391.41
  3. 基于特征描述的图像匹配方法研究,TP391.41
  4. 双目立体视觉关键技术研究,TP391.41
  5. 乳腺钼靶图像配准方法研究,TP391.41
  6. 双目立体视觉中摄像机自标定方法研究,TP391.41
  7. 基于多核学习的高性能核分类方法研究,TP391.41
  8. 基于双目立体全景视觉传感器的道路宽度实时检测技术的研究,TP274
  9. 基于双目视觉的河道测量技术研究,TP391.41
  10. 基于粒子滤波的目标跟踪算法研究,TP391.41
  11. 基于时空关键点的动作识别算法研究,TP391.41
  12. 交通监控视频中的目标检测与跟踪算法研究,TP391.41
  13. 基于最近邻及相似度测量检测钓鱼网页技术的研究,TP393.08
  14. 基于相似性测量检测图像型垃圾邮件技术的研究,TP393.098
  15. 基于局部特征的结构模型学习及其在目标检测与定位中的应用,TP391.41
  16. 基于图形处理器的SIFT算法研究,TP391.41
  17. 基于SIFT的数字水印算法研究,TP309.7
  18. 基于BoW-SIFT模型和层次网格特征的三维检索系统,TP391.41
  19. 基于多幅图像的几何和纹理自动重建,TP391.41
  20. 聚类集成算法及应用研究,TP311.13
  21. 图像制导模拟器图像生成研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com