学位论文 > 优秀研究生学位论文题录展示

基于笔段的脱机手写体汉字识别方法研究

作 者: 靳天飞
导 师: 曾广周
学 校: 山东大学
专 业: 计算机应用技术
关键词: 脱机手写体汉字识别 细化 特征点提取 笔段提取
分类号: TP391.41
类 型: 硕士论文
年 份: 2008年
下 载: 192次
引 用: 0次
阅 读: 论文下载
 

内容摘要


脱机手写体汉字识别具有广阔的应用前景和很高的理论价值。从应用角度来看,它可以广泛应用于各种纸质文档的高速自动录入,图书资料的数字化,邮件的自动分拣,证件的自动阅读,票据的自动处理等方面。从理论方面来讲,研究脱机手写体汉字识别可以认识高难度模式识别的一般规律,有助于发展新的模式识别理论,从而对传统的模式识别理论和技术在脱机手写体汉字识别中的局限性有所突破,且因它涉及到模式识别、图像处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、中文信息处理等许多学科,故脱机手写体汉字识别在相关学科研究和多学科的融合研究中都有很高的理论价值。从1966年IBM公司的Casey和Nagy首次发表印刷体汉字识别的文章开始算起,到现在汉字识别已有40多年的历史。经过无数科研工作者的不懈努力,汉字识别中的联机手写体识别和脱机印刷体识别已日趋成熟,出现了很多有实用价值的产品。只有脱机手写体识别至今还不能达到令人满意的效果,被称为文字识别中“最难征服的领域”,尤其是基于结构特征的手写体汉字识别更具有挑战性。它不能利用笔划顺序、书写轻重等重要信息,而且手写体汉字因人而异,字体繁多,其中连笔问题和变形问题是手写体汉字识别中的两大难点。因此,如何解决这些问题已经成为研究的热点。本文主要研究脱机手写体汉字识别中基于笔段的识别方法,涉及到模式识别、图像处理等技术。预处理在识别过程中占有重要地位,其中细化特征点提取是本文的研究重点。细化方法主要有2类,第1类是一遍扫描,得到单侧边缘;第2类是多遍扫描,得到中心线(骨架)。在第2类方法中,目前较成熟的是利用模板细化,但存在着模板数目太多,内存需求大,运算速度慢等缺陷。为弥补这一缺陷,一些学者提出了基于分组的细化方法,但远未成熟。有鉴于此,本文在此基础上提出了分组细化法,不仅能够较快地实现细化,而且同时能够标记出除拐点之外的特征点。具体地说,即逐个扫描字符图像像素点,由当前像素点8邻点的分组个数来判断此点类型,对笔划图像前景点逐层做类型标记(删除某点时仅做删除标记,不立即置为背景,直到下一轮扫描时,才视为背景),如此循环,直到所有前景点被标记完为止。在细化过程中,根据分组数,标记字符图像中心线中的孤立点(0分叉)、端点(1分叉)、骨架点(2分叉)和交叉点(3~8分叉)。拐点提取方法可分为以下2类:第1类方法是按局部特征来提取拐点,即从像素点入手。这一类方法运算量大,易受噪声干扰。第2类方法按全局特征来检测拐点,从笔划的整体形状入手,略去骨架的小波折。这类方法简单,检测速度快,受噪声影响小,适合于寻找汉字骨架上的拐点,如最大距离法。但最大距离法只能处理单拐点笔划,不能处理多拐点笔划,也不能判断笔划上拐点的个数。本文提出的远端拐点法,对最大距离法进行了改进。既保持了运算速度快、受噪声影响小的优点,又能判断笔划上拐点的个数,找出多拐点笔划上的所有拐点。实验证明,分组细化法和远端拐点法执行速度快,内存需求小,算法简单,效率高。最后,本文给出了脱机手写体汉字识别系统的流程,其中有些模块尚未实现,或尚有一定缺陷,这有待进一步研究。文中给出了部分算法和实验结果。本文相关程序是在Visual C++6.0环境中开发的。

全文目录


摘要  6-8
ABSTRACT  8-10
第一章 绪论  10-16
  1.1 引言  10-11
  1.2 发展状况  11-12
  1.3 当前面临的困难  12-14
  1.4 本文的工作与贡献  14-15
  1.5 本文的组织与安排  15-16
第二章 手写汉字识别基础  16-22
  2.1 脱机手写体汉字识别方法  16-18
    2.1.1 引言  16
    2.1.2 识别步骤  16-18
  2.2 汉字结构特征  18-20
    2.2.1 汉字结构的层次  18
    2.2.2 笔段和子笔划  18-19
    2.2.3 部件  19
    2.2.4 基本概念  19-20
  2.3 基于结构的识别方法  20-21
  2.4 本章小结  21-22
第三章 细化及分叉点识别  22-30
  3.1 引言  22-23
  3.2 现有方法的不足与改进  23-24
  3.3 改进的分组细化方法  24-29
    3.3.1 主要思想  24-26
    3.3.2 算法  26-27
    3.3.3 部分数据说明  27
    3.3.4 实验结果与分析  27-29
  3.4 本章小结  29-30
第四章 拐点识别  30-35
  4.1 引言  30
  4.2 现有方法的不足与改进  30-31
  4.3 远端拐点法  31-34
    4.3.1 主要思想  31
    4.3.2 算法  31-33
    4.3.3 实验结果与分析  33-34
  4.4 本章小结  34-35
第五章 脱机手写体汉字识别实验  35-53
  5.1 实验环境与识别流程  35-36
  5.2 预处理  36-44
    5.2.1 二值化  36-39
    5.2.2 噪音消除  39-41
    5.2.3 字符切分  41-43
    5.2.4 归一化  43-44
    5.2.5 细化  44
  5.3 特征提取与识别  44-51
    5.3.1 特征提取  44-48
    5.3.2 识别  48-51
  5.4 后处理  51-52
  5.5 本章小结  52-53
第六章 结论与展望  53-55
  6.1 总结  53-54
  6.2 进一步研究的方向  54-55
附录1 笔者选取的100个汉字及采集的汉字图像  55-60
附录2 部分程序清单  60-67
参考文献  67-72
致谢  72-73
攻读学位期间发表的学术论文目录  73-74
学位论文评阅及答辩情况表  74

相似论文

  1. 普碳钢中添加ZrO2纳米粒子对其组织和力学性能的影响,TB383.1
  2. 高机号经编纯毛针织内衣面料的可编织性及其服用性能研究,TS186
  3. 低比特率下基于DWT的视频编解码系统研究与实现,TN919.81
  4. 磁场作用下双丝埋弧焊热源的数值模拟及实验研究,TG445
  5. AlTi细化剂对Al-Mg2Si复合材料显微组织与力学性能的影响,TG27
  6. 变形镁合金形变热处理组织性能研究,TG146.22
  7. 超声波对喷射成形沉积坯质量的影响,TF124.39
  8. 5mm调频探测系统信号处理的研究与实现,TN911.7
  9. 手掌静脉识别系统,TP391.41
  10. 旋转机械全息谱分析精度提高方法的研究,TH165.3
  11. 指纹图像预处理算法的研究及DSP实现,TP391.41
  12. 基于多视点获取图像的拼接算法研究,TP391.41
  13. 工业CT图像二维矢量化系统研究与改进,TP391.41
  14. 黄麻工艺纤维拉伸细化研究,TS102.22
  15. 牦牛毛纤维拉伸细化改性研究,TS101.92
  16. 温热成形工艺技术在氧枪喷头产品中的应用研究,TF124.3
  17. 铝硅合金高温摩擦表层硅相细化和球化研究,TG453.9
  18. PQ600高强度工程机械用钢热轧工艺研究,TG335.11
  19. 过共晶高硼铸钢组织细化研究,TG142.1
  20. 高强铝合金超声搅拌复合焊工艺与机理研究,TG453.9
  21. 小孔径泡沫铝的制备及机理研究,TB383.4

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com