学位论文 > 优秀研究生学位论文题录展示

基于旋转不变性的印刷体数字识别

作 者: 蔡炯熙
导 师: 唐振民
学 校: 南京理工大学
专 业: 计算机应用
关键词: OCR 印刷体数字识别 旋转不变性 曲率序列
分类号: TP391.4
类 型: 硕士论文
年 份: 2002年
下 载: 302次
引 用: 10次
阅 读: 论文下载
 

内容摘要


字符识别技术中,在对具有复杂版面的字符进行识别时,要求不经过矫正直接识别具有大旋转角度的字符。针对这个问题,本文探讨了一种具有旋转不变性印刷体数字识别方法。 文中首先对待识别字符的预处理进行了研究,着重探讨了字符的细化过程,采用了一种基于数学形态学的保形的快速细化算法;接着探讨了如何以特征点和子笔段及其相互关系为基础构造结构模型,提出了一种以曲率序列性质描述子笔段的方法:最后采用了以知识库为基础的印刷体数字识别模型,并详细地描述了知识库的构造方法。 在多种字体的印刷体数字的不同旋转角度样本上进行的实验表明,该识别模型对具有大旋转角度的印刷体数字的识别效果良好。在对限制书写的手写体数字而言,该模型同样行之有效。

全文目录


1 绪论  7-13
  1.1 问题的提出  7-8
  1.2 OCR系统处理的一般步骤  8-10
  1.3 OCR方法分类  10
  1.4 OCR系统的发展研究现状  10-11
  1.5 本文研究工作概述  11-12
  1.6 本文内容安排  12-13
2 印刷体字符识别中的预处理技术  13-30
  2.1 引言  13
  2.2 二值化  13-17
    2.2.1 整体阈值二值化  14-15
    2.2.2 局部阈值二值化  15
    2.2.3 动态阈值二值化  15
    2.2.4 利用空间信息进行阈值选取  15-17
  2.3 平滑  17-18
  2.4 细化  18-30
    2.4.1 基于区域连通性的细化  19-22
      2.4.1.1 图像的连通性  19-20
      2.4.1.2 基于连通性的细化算法  20-22
    2.4.2 基于数学形态学的细化  22-30
      2.4.2.1 数学形态学的相关知识  22-24
      2.4.2.2 序贯同伦形态细化算法  24-25
      2.4.2.3 保形的快速形态细化  25-28
      2.4.2.4 实验效果  28-30
3 倾斜印刷体数字的特征提取  30-46
  3.1 引言  30-31
  3.2 曲线曲率序列的求取  31-33
    3.2.1 实用微分几何的相关知识  31
    3.2.2 离散图像情况下曲率的求取  31-32
    3.2.3 曲率序列的求取  32-33
  3.3 基元的抽取  33-40
    3.3.1 特征点的提取  33-36
    3.3.2 子笔段的抽取  36-40
      3.3.2.1 直线的判别  36-38
      3.3.2.2 闭合环的判别  38-39
      3.3.2.3 不规则笔段的判别  39-40
  3.4 标准数字的形态分析  40-43
    3.4.1 数字0的标准形态  40
    3.4.2 数字1的标准形态  40-41
    3.4.3 数字2的标准形态  41
    3.4.4 数字3的标准形态  41
    3.4.5 数字4的标准形态  41
    3.4.6 数字5的标准形态  41-42
    3.4.7 数字6的标准形态  42
    3.4.8 数字7的标准形态  42
    3.4.9 数字8的标准形态  42-43
    3.4.10 数字9的标准形态  43
  3.5 对字体变形情况的处理  43-45
    3.5.1 数字1的变形  43-44
    3.5.2 数字4的变形  44
    3.5.3 数字5的变形  44-45
    3.5.4 数字6的变形  45
    3.5.5 数字9的变形  45
  3.6 小结  45-46
4 倾斜印刷体数字识别的分类器设计  46-63
  4.1 引言  46
  4.2 各种类型分类器介绍  46-49
    4.2.1 模板匹配法  46-47
    4.2.2 统计决策法  47
    4.2.3 句法结构法  47-48
    4.2.4 模糊判决法  48
    4.2.5 逻辑推理法  48
    4.2.6 神经网络法  48-49
  4.3 基于知识库的分类器  49-62
    4.3.1 基于知识库的识别模型  49-50
    4.3.2 知识库框架  50-51
    4.3.3 模式描述语言设计  51-58
      4.3.3.1 关键字  51-52
      4.3.3.2 符号  52
      4.3.3.3 函数  52-53
      4.3.3.4 语法  53
      4.3.3.5 主描述体结构  53-54
      4.3.3.6 基元数量子描述体与语句  54-55
      4.3.3.7 基元关系子描述体与语句  55
      4.3.3.8 闭合环笔段子描述体与语句  55-57
      4.3.3.9 不规则笔段子描述体与语句  57-58
    4.3.4 模式描述语言解释器简介  58-61
      4.3.4.1 识别器工作流程  59
      4.3.4.2 解释器简介  59-60
      4.3.4.3 不规则笔段分析器  60-61
    4.3.5 知识库特性分析  61-62
  4.4 小结  62-63
5 实验结果分析  63-70
  5.1 实验数据简介  63-64
  5.2 训练结果  64-65
  5.3 识别实验与分析  65-69
  5.4 结论  69-70
结束语  70-71
致谢  71-72
参考文献  72-73

相似论文

  1. 数字图像中文字移除和修复系统的设计和实现,TP391.41
  2. 印刷体数学公式中矩阵结构分析方法的研究,TP391.4
  3. 基于非局部均值滤波的SAR图像去斑,TN957.52
  4. 图像实时匹配算法及其应用研究,TP391.41
  5. 比欧氏空间弱的一类空间的研究,O177
  6. 图像除噪进化滤波器的设计,TN713
  7. 嵌入式OCR系统的研究,TP391.41
  8. 遥感影像纹理特征提取与分析研究,TP751.1
  9. 具有某类特殊性质赋范空间相关问题的研究,O177.39
  10. 基于多分类器组合旋转不变的印刷体数字识别,TP391.43
  11. 基于Zernike矩的脱机手写签名鉴定研究,TP309
  12. 基于数字水印技术的证件防伪系统设计研究,TP309.7
  13. 仪表图像信息采集处理方法的研究,TH70
  14. 晶体和准晶的旋声性质的旋转不变性,O735
  15. 广域监视系统中的全景图生成技术研究,TP391.41
  16. 面向非结构环境图像理解的算法研究,TP391.41
  17. Web验证码的生成与识别,TP393.092
  18. 基于模型驱动的表格识别的研究,TP391.41
  19. 一种定位中文印刷体文档中数学表达式的方法,TP391.4
  20. 基于麦克风阵列的语音增强算法研究,TN912.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置
© 2012 www.xueweilunwen.com