学位论文 > 优秀研究生学位论文题录展示

基于DHMM的印刷体文字识别研究

作 者: 金长龙
导 师: 崔荣一
学 校: 延边大学
专 业: 计算机应用技术
关键词: 退化隐马尔柯夫模型 文字识别 细化
分类号: TP391.43
类 型: 硕士论文
年 份: 2005年
下 载: 205次
引 用: 1次
阅 读: 论文下载
 

内容摘要


本文面向工程应用提出了一种新颖的基于退化隐马尔柯夫模型(Degraded Hidden Markov Model)的印刷体文字识别方法。 由于印刷体文字的字形相对固定,因此以往通常采用结构化的识别方法,并且取得了不错的识别率。在特征向量提取上,结构化方法中大多采用细化算法取得所需的笔段,而细化会带来笔段提取的错误,笔段的错误又会导致后面的文法推理错误,从而出现误识,针对这种错误以往采用的方法都比较繁琐。在HMM应用于文字识别方面,无论是联机文字识别还是脱机文字识别,一般都只采用左右型的模型结构,然而左右型的模型结构并不适合于本文所设计的特征向量。 通过对印刷体文字结构的分析,在本文提出了一种新的代表一个文字的特征向量——笔段序列向量,在本文中又称为观测序列向量,采用这种特征表达方式能够将二维平面文字信息转化为一维随机信号,并且保留了文字的几何信息。针对所设计的特征向量,在传统的隐马尔柯夫模型(HMM)基础上提出了一个新的处理一维随机序列的分类器——退化隐马尔柯夫模型。本文中的分类器采用了完全不同的状态转移方式,所形成的模型结构为遍历型的结构模型,该模型结构在保持字形结构完整的前提下,不受字号的影响。 实验结果表明本文所提方法受字号的影响比较小,并且在分辨率达到一定程度后对于识别率的影响度比较小,证明所设计的特征向量及其分类器能够很好地实现宋体印刷文字的识别。

全文目录


摘要  3-4
ABSTRACT  4-5
目录  5-7
第一章 文字识别概述  7-14
  1.1 文字识别的研究概况  7-12
    1.1.1 文字识别的研究历程  7-8
    1.1.2 文字识别的分类  8
    1.1.3 汉字识别方法  8-12
  1.2 印刷体汉字的结构特点  12
  1.3 本文的主要研究内容及创新点  12-13
  1.4 本文的组织  13-14
第二章 隐马尔柯夫模型及其在文字识别中的应用  14-22
  2.1 隐马尔柯夫模型的基本原理  14-16
    2.1.1 HMM基本思想  14-15
    2.1.2 HMM基本概念  15
    2.1.3 HMM定义  15-16
  2.2 HMM基本算法  16-20
    2.2.1 前向算法  17-18
    2.2.2 后向算法  18-19
    2.2.3 Baum-Welch算法  19-20
  2.3 隐马尔柯夫模型在文字识别中的应用  20-21
    2.3.1 在联机识别中的应用  20-21
    2.3.2 在脱机识别中的应用  21
  2.4 本章小结  21-22
第三章 基于退化隐马尔柯夫模型的文字识别  22-30
  3.1 结构化特征的提取  22-24
    3.1.1 图像预处理  22-24
    3.1.2 观测序列的生成  24
  3.2 隐马尔柯夫模型的选择  24-29
    3.2.1 模型描述  24-26
    3.2.2 模型参数初始化  26-28
    3.2.3 分类器的分类原理  28-29
  3.3 特点  29
  3.4 本章小结  29-30
第四章 实验及其结果分析  30-35
  4.1 实验设计及其流程  30-32
    4.1.1 实验设计  30-31
    4.1.2 实验流程  31-32
  4.2 程序模块  32
  4.3 识别结果分析  32-35
结论与展望  35-36
参考文献  36-40
致谢  40

相似论文

  1. 普碳钢中添加ZrO2纳米粒子对其组织和力学性能的影响,TB383.1
  2. 高机号经编纯毛针织内衣面料的可编织性及其服用性能研究,TS186
  3. 低比特率下基于DWT的视频编解码系统研究与实现,TN919.81
  4. 磁场作用下双丝埋弧焊热源的数值模拟及实验研究,TG445
  5. AlTi细化剂对Al-Mg2Si复合材料显微组织与力学性能的影响,TG27
  6. 变形镁合金形变热处理组织性能研究,TG146.22
  7. 超声波对喷射成形沉积坯质量的影响,TF124.39
  8. 汽车轮胎表面标识识别系统的设计与研究,TP391.41
  9. 企业邮件监管系统的设计与实现,TP393.098
  10. 5mm调频探测系统信号处理的研究与实现,TN911.7
  11. 旋转机械全息谱分析精度提高方法的研究,TH165.3
  12. 指纹图像预处理算法的研究及DSP实现,TP391.41
  13. 黄麻工艺纤维拉伸细化研究,TS102.22
  14. 牦牛毛纤维拉伸细化改性研究,TS101.92
  15. 温热成形工艺技术在氧枪喷头产品中的应用研究,TF124.3
  16. 铝硅合金高温摩擦表层硅相细化和球化研究,TG453.9
  17. PQ600高强度工程机械用钢热轧工艺研究,TG335.11
  18. 过共晶高硼铸钢组织细化研究,TG142.1
  19. 高强铝合金超声搅拌复合焊工艺与机理研究,TG453.9
  20. 小孔径泡沫铝的制备及机理研究,TB383.4
  21. 电力系统谐波分析方法研究,TM711

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com