学位论文 > 优秀研究生学位论文题录展示

基于小波变换的印刷体汉字字体识别研究

作 者: 王连银
导 师: 孟庆浩
学 校: 天津大学
专 业: 控制理论与控制工程
关键词: 字体识别 小波变换 能量特征 能量比例特征 BP神经网络
分类号: TP391.41
类 型: 硕士论文
年 份: 2007年
下 载: 124次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着科学技术的进步,现代社会已进入高速发展的信息时代,纸质文档的处理量与日俱增,目前处理这类纸质文档最有效的方法是将文档的信息自动录入到计算机制成便于保存和传输的电子文档,即原文重现。文档字符识别(OCR)和字体识别是实现原文重现的两项主要的关键技术,其中字符识别技术的研究起步较早,目前已趋于成熟,然而字体识别的研究却并未受到足够地重视,研究尚处在初级阶段,但字体信息为版面分析、理解和恢复提供了重要依据,为此本文在现有研究基础上,针对汉字印刷体字体识别展开了研究。本论文的研究工作为进一步完善字体识别技术做了有益地尝试,部分研究成果具有很强的潜在应用价值。本文设计了一个印刷体汉字字体识别系统。算法设计主要思想:1)利用构成汉字的笔画可以由四种基本笔段组成(横、竖、撇、捺),而不同字体在笔段上存在明显差异;2)利用小波变换具有很好的局部方向分析的能力,便于提取基本笔段的字体特征。基于以上分析,本文提出了基于小波分析的标准汉字字体识别的新方法。算法的实现步骤如下:首先,对汉字的字符图像进行小波分解;然后,依据汉字的字型特点,在分解的各子图像上提取汉字基本笔段(横、竖、撇、捺)的能量特征及能量比例特征;最后,依据提取的字体特征进行分类识别,分类器采用BP神经网络。在包含六种常用字体的样本集上进行了测试,结果表明本文提出的算法能够对单字符字体进行有效地识别。

全文目录


中文摘要  2-3
Abstract  3-6
第一章 绪论  6-10
  1.1 字体识别的提出及意义  6-7
  1.2 字体识别研究的发展  7-8
  1.3 本文内容的主要安排  8-9
  1.4 本论文的主要工作  9-10
第二章 小波分析的理论基础  10-20
  2.1 小波分析的发展概况  10-11
  2.2 小波变换  11-17
    2.2.1 多分辨率分析  12-14
      2.2.1.1 一维多辨率分析  12-13
      2.2.1.2 二维多辨率分析  13-14
    2.2.2 Mallat 算法  14-17
      2.2.2.1 一维Mallat 算法  14-15
      2.2.2.2 二维Mallat 算法  15-17
  2.3 常用小波函数  17-20
第三章 汉字字体的特征及字体识别的预处理  20-34
  3.1 汉字字体的特征  20-22
  3.2 汉字字体识别的预处理  22-33
    3.2.1 图像的输入  22-25
    3.2.2 图像的预处理  25-33
      3.2.2.1 图像二值化  26-27
      3.2.2.2 图像倾斜的调整  27-29
      3.2.2.3 汉字的行切割与字切割  29-31
      3.2.2.4 汉字的归一化  31-33
  3.3 小结  33-34
第四章 汉字字体的特征及字体识别的预处理  34-48
  4.1 字符图像的小波分解  34-36
  4.2 字符图像的特征分析  36-39
  4.3 字符图像字体特征的提取  39-47
    4.3.1 特征提取的方法分析  39-41
    4.3.2 字符图像的能量分析  41-43
    4.3.3 字符图像的特征提取  43-47
      4.3.3.1 字符图像的能量特征提取  43-45
      4.3.3.2 字符图像的能量比例特征提取  45-47
  4.4 小结  47-48
第五章 印刷体汉字单字字体识别器的设计  48-58
  5.1 BP神经网络简介  48-49
  5.2 BP神经网络的基本算法  49-55
    5.2.1 BP神经网络的基本算法推导  49-51
    5.2.2 BP神经网络的基本算法相关参数说明  51-53
    5.2.3 基于BP神经网络的字体识别算法描述  53-55
  5.3 实验的结果  55-57
    5.3.1 实验样本的选择  55-56
    5.3.2 识别结果  56-57
  5.4 小结  57-58
第六章 结束语  58-59
参考文献  59-62
发表论文和科研情况说明  62-63
致谢  63

相似论文

  1. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
  2. 图像的稀疏表示及编码模型研究,TP391.41
  3. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  4. 唇读中的特征提取、选择与融合,TP391.41
  5. 机械臂视觉伺服系统的研究,TP242.6
  6. 市级旅游用地规划环境影响评价研究,X820.3
  7. 珠三角地区高性能混凝土配合比智能化系统,TU528
  8. 大学生综合素质测评研究,G645.5
  9. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  10. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  11. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  12. 高速公路拆迁民众生存系统评价研究,D523
  13. 感觉刺激诱发脑电特征研究,R318.0
  14. 网络传输中的ROI图像编码算法研究,TN919.81
  15. 煤矿风险信息集成与智能预警研究,X936
  16. 基于计算机视觉的柑橘品质分级技术研究,TP391.41
  17. 基于多尺度分析的图像融合算法研究,TP391.41
  18. 基于小波变换的三维模型特征提取技术的研究与实现,TP391.41
  19. 轮廓波变换及其在图像处理中的应用,TP391.41
  20. 基于小波的雷达视频压缩方法研究,TN957.52
  21. 脊波变换在全色图像和多光谱图像融合中的应用研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com