学位论文 > 优秀研究生学位论文题录展示
基于定性映射与转化程度函数的汉字识别
作 者: 李文佩
导 师: 冯嘉礼
学 校: 上海海事大学
专 业: 计算机软件与理论
关键词: 汉字识别 属性论方法 定性映射 转化程度函数 记忆模式
分类号: TP391.4
类 型: 硕士论文
年 份: 2004年
下 载: 86次
引 用: 11次
阅 读: 论文下载
内容摘要
文字识别是模式识别的一个重要分支,其任务是研究如何使计算机能够“识字”。它涉及模式识别、图象处理、数字信号处理、模糊数学等学科,是一门综合性技术,在中文信息处理、办公室自动化、机器翻译、人工智能等高技术领域,都有着重要的实用价值和理论意义。 本文在介绍了属性论的一些基本观点、方法和理论后,利用属性论中的定性映射及转化程度函数研究并丌发了一套简要的汉字识别系统,将字符(模式)看作点的集合进行训练得到汉字的记忆模式。识别时利用m维加权转化程度函数即可求得输入模式与参考模式的相似度。转化程度函数的引入使得生成和识别过程带有了模糊性,这恰好反映了人脑思维过程本身带有的模糊性。 本方法的创新之处在于能够生成实在、可见的汉字记忆模式,而且没有统计识别方法大样本量的要求,只需较少(几个)的样本即可。本汉字识别程序运行结果证明我们的方法学习速度非常快(对1280个汉字,训练时间为15秒左右),对学习过的印刷体汉字识别率高达100%,对规整手写体汉字识别率达86.2%。
|
全文目录
第一章 汉字识别技术发展简介 7-15 1.1 模式识别简介 7 1.2 模式识别研究的发展情况 7 1.3 汉字识别技术发展简介 7-9 1.4 联机字符识别原理 9-10 1.5 汉字识别方法 10-13 1.5.1 统计识别方法 10-12 1.5.2 结构方法 12 1.5.3 统计识别与结构识别的结合 12-13 1.5.4 模糊模式识别 13 1.5.5 神经网络模式识别 13 1.6 汉字识别中存在的问题及困难 13-14 1.7 本文使用的理论依据与方法 14-15 第二章 判断的定性映射模型和基准的w_内积变换诱导的线性规划问题、人工神经元与模式识别 15-41 2.1 引言 15-16 2.2 事物质量互变规律诱导的最简性质判断及其定性映射模型 16-19 2.3 基准c_p为区间向量和区间矩阵的定性映射与初等判断 19-23 2.3.1 基准c_p为区间向量的定性映射 19-21 2.3.2 基准c_p为区间矩阵的定性映射和合取性质的初等判断 21-23 2.4 定性基准的内积变换及其诱导的平行超多面体和线性规划问题 23-28 2.5 定性基准w_内积变换诱导的人工神经元 28-30 2.6 初等判断与模式识别 30-31 2.7 统计模式识别中的特征向量法及其定性映射模型 31-35 2.7.1 统计模式识别中的特征向量法 31-32 2.7.2 模式识别中的结构变换 32-33 2.7.3 结构变换与形象模式生成或“涌现” 33-35 2.8 转化程度函数 35-40 2.8.1 量-转化的程度差异及其转化程度函数 35-37 2.8.2 定性基准模糊化 37-38 2.8.3 定性映射与特征函数 38-39 2.8.4 转化程度函数η_P(X) 39-40 2.9 结论 40-41 第三章 基于定性映射与程度函数的汉字学习与识别 41-57 3.1 算法概要 41-42 3.2 算法细节介绍 42-44 3.2.1 字符特征向量的数据结构 43 3.2.2 田字格权值组合代码 43-44 3.2.3 误差半径 44 3.2.4 样本库与字典 44 3.3 学习流程 44-50 3.3.1 原始样本预处理 44-47 3.3.2 原始样本预学习 47 3.3.3 训练 47-50 3.4 字符识别 50-53 3.4.1 相似度定义 50-52 3.4.2 印刷体字符识别流程 52 3.4.3 手写体字符识别流程 52-53 3.5 汉字的切割 53-57 3.5.1 行切割 54 3.5.2 字切割 54-55 3.5.3 本文采用的字切割方法 55-57 第四章 测试结果与分析 57-61 4.1 运行环境 57 4.2 程序界面 57 4.3 测试结果 57-60 4.3.1 学习 57-58 4.3.2 单字识别 58-59 4.3.3 行识别 59-60 4.4 结果分析 60-61 致谢 61-62 参考文献 62-64
|
相似论文
- 图片检索在网络敏感信息实时预警系统中的应用,TP391.41
- 基于稀疏表示的脱机手写体汉字识别研究,TP391.1
- 基于动态粗外围方向线素特征的脱机手写汉字识别,TP391.43
- 手写体汉字识别方法研究,TP391.43
- 包装箱表面印刷体汉字识别算法研究,TP391.41
- 基于结构分析的离线手写汉字切分,TP391.43
- 基于PCA车牌汉字识别算法的研究与实现,TP391.41
- 方言经验对于儿童早期语素意识与词汇阅读的影响,H193.1
- 印刷体中文文档中表格和汉字的识别研究,TP391.41
- 泰国学生汉语发音质量与语音意识和汉字识别的关系,H195
- 基于Gabor理论的脱机手写汉字识别,TP391.43
- 基于笔顺重排的联机手写汉字识别的研究与实现,TP391.43
- 基于笔段特征与方向特征的联机手写汉字识别研究,TP391.41
- 基于特征融合的脱机手写体汉字识别,TP391.43
- 联机手写汉字识别关键技术研究,TP391.43
- 手写体汉字结构的全局统计建模与识别方法研究,TP391.41
- 无约束联机手写汉字特征提取与识别融合的研究,TP391.41
- 联机手写汉字的旋转无关识别研究,TP391.43
- 汉字识别对Multiple Read-Out模型的检验,B842.5
- 基于ILDA的用户书写风格自适应方法及其应用,TP391.43
- SIFT与BIM特征提取方法的研究与应用,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置
© 2012 www.xueweilunwen.com
|