学位论文 > 优秀研究生学位论文题录展示
仿人识别手写体汉字的容错编码方法研究
作 者: 赵丽欣
导 师: 王建平
学 校: 合肥工业大学
专 业: 检测技术与自动化装置
关键词: 脱机手写体汉字识别 容错编码 字型分类和提取 字元集 子结构
分类号: TP391.41
类 型: 硕士论文
年 份: 2006年
下 载: 73次
引 用: 3次
阅 读: 论文下载
内容摘要
人类视觉感知是一个鲁棒性很强的、能抵御实际中各种变形和噪声干扰的具有良好容错性的文字识别系统。近年来,围绕手写体汉字图像识别的研究在很多方面已取得了重要进展。但如何提取与汉字结构类别密切相关的特征制定冗余容错的编码方法,提高机器仿人识别手写体汉字图像的灵活和容错性是值得研究的方法之一。 论文的主要工作如下: 1) 图像汉字的字型分类及提取。提出了一种图像汉字字型两级划分法。采用基于水平和垂直投影直方图与连通域相结合的方法,提取图像汉字的字型结构分类特征,并给出了字型分类编码。该算法能有效的对手写体汉字字型进行分类。 2) 图像汉字的容错编码方法。提出了一种用于机器识字的汉字容错编码方法。定义了仿人拆字的笔划字元集,给出易混淆笔划字元的多归类容错编码;归结了36类简单常用的子结构及笔划字元的顺序判断规则,并给出冗余的容错编码;建立了仿人构字的汉字编码规则和具有容错性的多模板字典。该方法能降低手写体汉字变形等因素的影响。 3) 基于容错编码的汉字识别。给出了基于容错编码的图像汉字识别方法。制定汉字统计特征码、字型特征码和笔划字元特征码的比对规则,给出了一种基于汉字图形轮廓特征的误差估计方法,并利用误差估计建立了一套带有反馈的汉字容错识别方法。 4) 可分类性和重码率分析。给出了标准样本汉字编码重码率和重码汉字的类型分析,并对重码汉字进行处理。 5) 容错性分析。对整个编码的容错性进行理论分析,给出手写体汉字的识别结果,并对拒识和误识汉字类型进行分析。 本文研究表明:基于容错编码的汉字识别算法能够有效地表征和区分出手写体汉字集,对笔划和字体的变形都有很好的容错性,能够有效提高识别系统的抗干扰性和识别率。
|
全文目录
第一章 汉字识别概述 13-20 1.1 字符识别及手写体汉字识别的历史回顾和研究现状 14-15 1.2 手写体汉字识别的一般步骤 15 1.3 手写体汉字识别的方法分析与技术难点 15-17 1.3.1 手写体汉字识别的方法分析 15-16 1.3.2 手写体汉字识别的技术难点 16-17 1.4 当前的研究热点 17-18 1.5 本课题研究的意义及论文的内容 18-20 第二章 手写体汉字图像字型特征的分类和提取 20-26 2.1 汉字字型特征的分类 20-21 2.2 汉字字型代码表的建立 21 2.3 汉字字型特征的提取 21-24 2.3.1 汉字水平和垂直投影直方图 21-22 2.3.2 像素间的邻接性、连通性 22-23 2.3.3 字型特征的提取 23-24 2.4 实验结果 24-25 2.5 小结 25-26 第三章 汉字的仿人容错编码方案 26-40 3.1 手写体汉字图像的特点 26-27 3.2 汉字的笔划形态特征 27-28 3.2.1 汉字的五种笔划 27-28 3.2.2 横竖撇捺笔划的模糊化表示 28 3.3 构字时笔划间的关系 28-29 3.4 图像汉字的字元表征 29-30 3.4.1 字元的选取 29-30 3.4.2 字元代码表的建立 30 3.4.3 字元码的容错分析 30 3.5 图像汉字字元顺序特征的规定 30-31 3.5.1 单笔划字元的字元顺序判断 30-31 3.5.2 复笔划字元的字元顺序判断 31 3.5.3 汉字字元的顺序选取规则 31 3.6 图像汉字的子结构 31-33 3.6.1 子结构的选取依据 31-32 3.6.2 子结构代码和构成表 32-33 3.6.3 子结构的容错分析 33 3.7 图像汉字的统计特征选取 33-35 3.7.1 相交点数量提取算法 33-34 3.7.2 横笔划数量提取算法 34-35 3.7.3 竖笔划数量提取算法 35 3.8 图像汉字的编码规则 35-38 3.8.1 汉字统计特征码编码规则 35-36 3.8.2 汉字字型特征码编码规则 36 3.8.3 汉字笔划字元码编码规则 36-37 3.8.4 汉字编码规则 37-38 3.9 重码与容错码的分析 38-39 3.9.1 重码字的分析 38 3.9.2 冗余容错编码机制 38-39 3.10 小结 39-40 第四章 基于容错编码的汉字识别 40-47 4.1 手写体汉字图像统计特征编码比对规则 40-41 4.2 手写体汉字图像字型特征编码比对规则 41 4.3 手写体汉字图像笔划字元特征编码比对规则 41-42 4.4 手写体汉字图像编码识别方法步骤和算法流程 42-43 4.5 基于外围轮廓特征的误差估计和置信度评价 43-44 4.6 仿人校验容错识别 44-45 4.7 识别重码汉字处理 45-46 4.8 小结 46-47 第五章 实验结果和分析 47-56 5.1 对样本汉字的编码结果及分析 47-48 5.1.1 对样本汉字编码结果 47 5.1.2 重码汉字类型分析 47-48 5.2 手写体汉字的识别实验及分析 48-55 5.2.1 手写体汉字识别举例 48-51 5.2.2 样本汉字集编码 51-54 5.2.3 对手写体汉字的识别结果 54 5.2.4 误识和拒识汉字类型分析 54-55 5.3 小结 55-56 第六章 总结与展望 56-58 参考文献 58-59
|
相似论文
- 黑曲霉脂肪酶盖子结构域突变对其活性影响的研究,TQ925
- 实时子结构试验数值积分方法研究,TU317
- 基于中阶模态的固定界面子结构精确综合,TB122
- 基于子结构方法的微电子集成电路封装互连焊球可靠性的建模与仿真,TN405
- 柴油发动机主体结构系统动态特性研究,TK427
- 基于HyperWorks的轨道车辆零部件拓扑优化设计,U270.2
- 基于模型预测—修正算法的分布式混合试验系统,TU311.3
- 地震模拟振动台子结构实验方法数值模拟,P315.8
- 地震模拟振动台子结构混合试验边界条件的模拟方法研究,TU317.1
- 隐式实时子结构试验方法的数值特性分析,TU317
- 多维多点地震输入拟动力实验方法研究,U441.3
- 考虑作动器特性的实时子结构试验等效力控制方法,TP273
- 面向三维场景生成的中文语义角色标注方法研究,TP391.1
- 辣椒生长的三维可视化模拟研究,TP391.9
- 面向飞行器设计的分布并行算法的研究,V222
- 钢桁架拱桥结构基于神经网络的损伤识别法,U448.22
- 力限振动试验界面力的计算模型及其简化研究,V216.21
- 面向大数据块的快速多容错编码研究,TP302.8
- 结构物理参数时域识别方法的研究,TU311
- 求解大型复杂结构特征值问题的Lanczos分布式并行算法研究,O241.6
- 自适应子结构拟动力试验方法,TU311.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|