学位论文 > 优秀研究生学位论文题录展示

低质量文档图像的二值化研究

作 者: 胡丽娜
导 师: 张重阳
学 校: 南京理工大学
专 业: 模式识别与智能系统
关键词: 低质量文档图像 二值化 梯度归一化 视觉注意机制 显著图
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 62次
引 用: 0次
阅 读: 论文下载
 

内容摘要


二值化是文档自动处理系统的一个关键预处理过程,直接影响系统的整体性能。低质量文档是由复杂背景和弱笔画等诸多因素引起的,其二值化是当前文档处理研究的热点和难点。本论文分析了文档质量下降的主要原因,重点对具有弱笔画、墨迹浸润现象以及背景亮度深浅不一的低质量文档图像二值化方法进行研究。本文研究了Su提出的基于局部最大值和最小值的文档图像二值化方法,针对其处理弱笔画的不足提出了一种新的基于梯度归一化的文档图像二值化方法。首先根据归一化梯度检测字符笔画的边缘点;然后通过极值滤波获得笔画的边缘区域;最后计算笔画边缘区域的局部阈值并进行二值化。与Otsu方法、Niblack方法以及Su方法进行了对比实验,结果表明,本文提出的基于梯度归一化的二值化方法不仅能够有效的检测出字符信息,而且产生的噪声较少。视觉注意机制在目标检测、图像压缩和图像检索等领域中得到了广泛的应用,但是在文档处理领域中的应用却鲜有报道。本文从视觉注意机制的角度出发,分析了文档图像的特征,并对视觉注意机制在文档图像二值化上的应用进行了探索,提出了基于显著图的区域全局阈值和局部阈值两种二值化方法。其中,区域全局阈值方法是对字符区域采用统一的阈值进行二值化,由于字符区域大小与字符的分布有关,所以该方法的效果不太理想,实验结果表明该方法优于常用的Otsu方法和Niblack方法,但是劣于Su方法;局部阈值方法是对字符区域采用局部阈值进行二值化,实验结果表明,该方法的处理效果要优于Otsu方法、Niblack方法以及Su方法。

全文目录


摘要  3-4
Abstract  4-7
1 绪论  7-11
  1.1 背景和意义  7-8
  1.2 国内外研究现状  8
  1.3 低质量文档图像分析  8-10
  1.4 主要工作和内容组织  10-11
    1.4.1 主要工作  10
    1.4.2 内容组织  10-11
2 文档图像二值化方法概述  11-18
  2.1 引言  11
  2.2 全局阈值法  11-15
    2.2.1 Otsu方法  11-12
    2.2.2 最优阈值法  12-13
    2.2.3 简单统计阈值法  13
    2.2.4 基于熵的阈值法  13-14
    2.2.5 基于聚类的阈值法  14-15
  2.3 局部阈值法  15-16
    2.3.1 Niblack方法  15-16
    2.3.2 Sauvola方法  16
    2.3.3 Bernsen方法  16
    2.3.4 White方法  16
  2.4 本章小结  16-18
3 基于梯度归一化的文档图像二值化  18-34
  3.1 引言  18-19
  3.2 方法描述  19-26
    3.2.1 梯度归一化  19-22
    3.2.2 检测笔画边缘像素点  22-24
    3.2.3 局部二值化  24-26
  3.3 实验结果与分析  26-33
  3.4 本章小结  33-34
4 基于显著图的文档图像二值化  34-58
  4.1 引言  34
  4.2 视觉注意机制与物体显著性  34-40
    4.2.1 视觉注意机制  34-35
    4.2.2 物体显著性  35-40
  4.3 方法描述  40-50
    4.3.1 文档图像显著性  41-45
    4.3.2 检测显著性区域  45-48
    4.3.3 区域二值化  48-50
  4.4 实验结果与分析  50-57
  4.5 本章小结  57-58
5 总结与展望  58-59
致谢  59-60
参考文献  60-62

相似论文

  1. 车牌识别系统中车牌定位算法的研究,TP391.41
  2. 艺术肖像剪纸生成及其心理认知评价,TP391.41
  3. 人脸特征点自动标注及表情生成,TP391.41
  4. 基于数字图像处理的电能表图像识别技术研究与实现,TP391.41
  5. 基于数字图像处理的车牌定位算法的研究,TP391.41
  6. 基于拓扑性质的视觉注意力模型的研究及其应用,TP391.41
  7. 实时车牌分割与识别技术研究,TP391.41
  8. 指纹识别相关算法的改进研究,TP391.41
  9. 手掌静脉网图像的获取与细化技术研究,TP391.41
  10. 基于视觉注意机制的运动目标识别算法研究,TP391.41
  11. 纤维图像光照不均修正算法的研究,TP391.41
  12. 二值化及其在支票识别预处理中的应用,TP391.41
  13. 辅助无人机飞行控制的人造目标检测技术,TP751
  14. 韩国车牌定位系统的研究与设计,TP391.41
  15. 车牌识别若干问题研究,TP391.41
  16. 视频文字提取技术研究与应用,TP391.41
  17. 三维对象重构技术的研究,TP391.41
  18. 面向智能监控中动态感兴趣区域的识别和编码,TP391.41
  19. 车牌识别系统的主要技术研究,TP391.41
  20. 指纹识别中图像处理方法的设计与实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com