学位论文 > 优秀研究生学位论文题录展示
基于模式—向量转化和转化程度函数的汉字识别
作 者: 李晓新
导 师: 冯嘉礼
学 校: 上海海事大学
专 业: 计算机软件与理论
关键词: 汉字识别 模式—向量转化 定性映射 转化程度函数 属性论
分类号: TP391.43
类 型: 硕士论文
年 份: 2005年
下 载: 82次
引 用: 0次
阅 读: 论文下载
内容摘要
汉字是中华文化集体智慧的结晶,进入信息时代后,原来依靠图形记载在纸上的汉字有了电子化的记载方式。汉字识别是研究如何使计算机能够“识字”的工作,它涉及模式识别、人工智能、模糊数学、信息论、计算机等学科,是一门综合性技术,在中文信息处理、办公室自动化、人工智能等高技术领域,具有重要的实用价值和理论意义。 本文介绍了属性论方法的基本观点、理论和方法,提出了基于模式——向量转化和定性映射及其转化程度函数的汉字识别方法,讨论了该方法与经典统计模式识别方法中的特征抽取和结构模式识别方法的结构分析法的关系,并指出,因经典统计模式识别方法中的特征抽取可看作是一个模式——向量转化操作,而结构模式识别方法的结构分析则可看作是由诸子模式构成的一个(超级)向量,故也可理解为一种模式——向量转化操作,由于向量识别可归结为一个定性映射,所以,本文在一定程度上可融合两种经典方法的优点。 还有必要指出的是,本文之所以采用Gauss型定性转化程度函数用于相似度的计算,不仅仅因为它本身表达的就是向量X向向量G转化的程度,因而也就是X和G之间的相似度,还在于它能诱导出一个人工神经元,并具有导致定性基准模糊化的特征,同时,还可以避免因采用cosθ作为相似度而存在的以共线性代替相似性的隐患。 正由于这些原因,在本文所开发的系统中,经样本学习后所生成的汉字模式记忆库和相应的汉字识别过程,不仅具有人工神经元的并行分布式计算特征,而且,其识别和分类操作还具有明显的模糊化特征。 本文在学习的过程中能够生成实在、可见的记忆库,并且学习的速度很快。然而,利用属性论方法进行汉字识别还处于试验和探索阶段,也存在着一些缺点和不足,需要在今后不断的改进和提高。
|
全文目录
第一章 引言 9-15 1.1 研究汉字识别的目的和意义 9-10 1.2 汉字识别的发展 10-11 1.3 目前汉字识别中存在的问题 11-12 1.4 论文背景和研究的主要内容 12-14 1.4.1 论文背景 12 1.4.2 研究的主要内容 12-14 1.5 本文的内容安排 14-15 第二章 汉字识别的方法 15-20 2.1 汉字识别的原理 15 2.2 汉字识别的方法 15-18 2.2.1 结构模式识别 16 2.2.2 统计模式识别 16-18 2.2.3 人工神经网络 18 2.2.4 结构模式识别与统计模式识别的结合 18 2.3 小结 18-20 第三章 汉字识别中的图像预处理 20-29 3.1 汉字图像的二值化 20-22 3.1.1 阈值法基本原理 20-21 3.1.2 二次定值法 21 3.1.3 实验结果 21-22 3.2 汉字图像的平滑去噪 22-24 3.2.1 邻域平均法原理 22-23 3.2.2 邻域平均法的改进 23-24 3.2.3 实验结果 24 3.3 二值化图像的细化 24-26 3.3.1 数学形态学 24 3.3.2 骨架的提取算法 24-26 3.4 汉字图像的归一化 26-28 3.4.1 基于边框的归一化 26-27 3.4.2 基于质心的归一化 27-28 3.5 小结 28-29 第四章 汉字识别中的分类算法 29-34 4.1 汉字识别的粗分类算法 29-30 4.1.1 基于网格的粗分类算法 29-30 4.1.2 基于外围特征的粗分类算法 30 4.2 汉字识别的细分类算法 30-33 4.2.1 汉字的特征点 30-32 4.2.2 特征点提取算法 32-33 4.3 小结 33-34 第五章 模式——向量转化和转化程度函数在汉字识别中的应用 34-56 5.1 属性论方法的基本观点和基本原理 34-35 5.2 属性量——质(转化)定性映射 35-50 5.2.1 定性基准的w_内积变换与人工神经元 39-42 5.2.2 模式识别中的模式——向量转化 42-46 5.2.3 定性映射和特征函数 46-47 5.2.4 量——质转化程度函数 47-50 5.3 结构变换与形象模式生成或“涌现” 50-52 5.3.1 结构变换 50-51 5.3.2 形象模式生成和涌现 51-52 5.4 距离公式和相似度函数的选择 52-53 5.5 属性论方法在汉字识别中的实现 53-55 5.6 小结 55-56 第六章 汉字识别系统的实现 56-65 6.1 汉字识别系统的流程图 56-57 6.2 样本库与字典 57 6.3 算法详解 57-61 6.3.1 特征向量中各分量的误差半径 57-59 6.3.2 标准记忆库模式 59 6.3.3 相似度的计算 59-61 6.4 主要数据结构 61-62 6.5 程序开发平台 62 6.6 实验结果 62-63 6.7 小结 63-65 结束语 65-67 发表文章 67-68 致谢 68-69 参考文献 69-71
|
相似论文
- 图片检索在网络敏感信息实时预警系统中的应用,TP391.41
- 基于稀疏表示的脱机手写体汉字识别研究,TP391.1
- 基于动态粗外围方向线素特征的脱机手写汉字识别,TP391.43
- 手写体汉字识别方法研究,TP391.43
- 包装箱表面印刷体汉字识别算法研究,TP391.41
- 基于结构分析的离线手写汉字切分,TP391.43
- 基于PCA车牌汉字识别算法的研究与实现,TP391.41
- 方言经验对于儿童早期语素意识与词汇阅读的影响,H193.1
- 印刷体中文文档中表格和汉字的识别研究,TP391.41
- 泰国学生汉语发音质量与语音意识和汉字识别的关系,H195
- 基于Gabor理论的脱机手写汉字识别,TP391.43
- 基于笔顺重排的联机手写汉字识别的研究与实现,TP391.43
- 基于笔段特征与方向特征的联机手写汉字识别研究,TP391.41
- 基于特征融合的脱机手写体汉字识别,TP391.43
- 联机手写汉字识别关键技术研究,TP391.43
- 手写体汉字结构的全局统计建模与识别方法研究,TP391.41
- 无约束联机手写汉字特征提取与识别融合的研究,TP391.41
- 联机手写汉字的旋转无关识别研究,TP391.43
- 汉字识别对Multiple Read-Out模型的检验,B842.5
- 基于ILDA的用户书写风格自适应方法及其应用,TP391.43
- SIFT与BIM特征提取方法的研究与应用,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com
|