学位论文 > 优秀研究生学位论文题录展示
基于BP神经网络和HMM混合模型的脱机手写体汉字识别
作 者: 王晓
导 师: 孙华志
学 校: 天津师范大学
专 业: 计算机应用技术
关键词: 模式识别 手写体汉字识别 预处理 BP神经网络 HMM
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 2次
引 用: 0次
阅 读: 论文下载
内容摘要
随着社会的不断发展进步,在人们的日常生产生活中,经常需要处理大量的文字、文本、报表等等。使用人工键盘输入已经不能够充分满足人们的信息需求,如何使用计算机快速、准确地识别文字已日趋重要。脱机手写体汉字识别技术作为字符识别技术(OCR)的一个分支,已经成为了模式识别领域新的研究热点。人工神经网络具有容错好、自适应强、能够模仿人脑智能等优点,可以处理环境复杂、背景不清、推理规则不明确的问题。因此将神经网络理论应用于手写体汉字识别有较大的理论意义和实践价值。本文主要对神经网络的基本原理、基础方法以及有关算法等进行了研究,在此基础上针对BP神经网络算法存在的学习算法收敛慢和局部极小值的问题采用了附加动量项法和改进误差函数来改进BP算法。同时针对BP神经网络建模能力弱的缺点设计并实现了一个基于BP神经网络和HMM混合模型的脱机手写体汉字识别系统。BPNN-HMM混合模型不仅能够充分利用BPNN优秀的分类识别能力,又可以通过HMM强大的时域建模能力来弥补BPNN建模能力弱的不足。因此该模型具有强大的建模能力、分类能力和自适应能力。本文首先对预处理部分的各个操作和相应的常用方法以及算法进行了简要介绍,其中详细介绍了本文采用的中值滤波去噪、阈值二值化算法。在特征处理部分,介绍了结构特征提取和统计特征提取两种特征提取方法以及本文实现的基于投影边界链的特征提取方法。在此基础上,提出并实现了一种基于BP算法和HMM混合模型的识别方法来提高识别性能。最后在MATLAB(R2009b)环境下,进行了识别仿真实验,对零~玖这十个大写汉字进行识别。实验结果表明,用本文所提出的方法进行脱机手写体字符识别是可行的,其识别准确率达到89.0%,优于现有的一些方法。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第一章 绪论 9-17 1.1 汉字识别的研究背景及意义 9-11 1.2 手写体汉字识别研究现状 11-12 1.3 手写体汉字识别的问题与困难 12-15 1.3.1 汉字规模大、字体多 13 1.3.2 汉字结构繁杂、字形相近 13-14 1.3.3 手写体风格迥异、随意性大 14 1.3.4 缺乏稳定性 14 1.3.5 缺乏系统的理论研究 14-15 1.4 本文主要研究内容及结构 15-17 第二章 脱机手写体汉字识别基本原理 17-30 2.1 图像的获取 17-18 2.2 图像预处理 18-24 2.2.1 平滑去噪 18-19 2.2.2 二值化 19-21 2.2.3 行字切分 21-22 2.2.4 归一化 22-23 2.2.5 细化 23-24 2.3 特征提取 24-27 2.3.1 特征提取的必要性 24-25 2.3.2 特征提取的方法 25-27 2.4 分类识别 27-30 2.4.1 单分类器 28 2.4.2 多分类器集成方法 28-30 第三章 神经网络在汉字识别中的应用 30-40 3.1 人工神经网络 30-33 3.1.1 人工神经网络原理 31-32 3.1.2 人工神经网络在汉字识别中的应用 32-33 3.2 BP神经网络 33-40 3.2.1 BP神经网络的原理 33-34 3.2.2 BP神经网络算法的实现 34-35 3.2.3 基于BP神经网络结构的设计 35-36 3.2.4 BP神经网络算法的改进 36-37 3.2.5 BP神经网络算法的学习和训练 37-40 第四章 基于改进的BPNN与HMM的手写体汉字识别 40-50 4.1 BPNN-HMM混合模型的优势 40-41 4.2 隐马尔可夫模型 41-44 4.2.1 隐马尔可夫模型概念 41-42 4.2.2 隐马尔科夫模型的三个问题和相应算法 42-44 4.3 基于改进的BPNN与HMM的脱机手写体汉字识别 44-50 4.3.1 特征提取 44-45 4.3.2 HMM模型选择和参数设置 45-46 4.3.3 BPNN-HMM模型训练 46-47 4.3.4 分类识别 47-50 第五章 脱机手写体汉字识别系统的设计与实现 50-54 5.1 总体设计 50 5.2 前台图像处理程序 50-52 5.3 数据库设计 52-53 5.4 识别结果 53-54 第六章 总结与展望 54-56 6.1 总结 54-55 6.2 展望 55-56 参考文献 56-60 致谢 60
|
相似论文
- 基于流形学习的高维流场数据分类研究,V231.3
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 舌图像中瘀斑瘀点检测技术研究,TP391.41
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 机械臂视觉伺服系统的研究,TP242.6
- 市级旅游用地规划环境影响评价研究,X820.3
- Cu2+/Co2+催化漂白桉木浆工艺与机理研究,TS745
- 离子液体预处理纤维素及再生纤维素水解研究,TQ352.1
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 基于回波包络的超声波入侵探测在军队警戒巡逻中的应用,E919
- 玉米秸秆和牛粪混合厌氧发酵工艺优化研究,S216.4
- 红外图像目标识别及跟踪技术研究,TP391.41
- 大鼠皮层神经细胞膜离子通道电流测量与重构,Q42
- 丁苯酞预处理对大鼠脑缺血再灌注损伤的神经保护作用,R743.33
- 语音识别技术研究与实现,TN912.34
- JSYJ公司采购风险管理研究,F426.92
- 不同时间的缺血预处理对大鼠肝硬化缺血再灌注损伤的保护作用,R575.2
- 基于模拟的注塑模浇注系统及成型工艺参数优化研究,TQ320.662
- 织物疵点检测与自动化等级评定系统研究,TP391.41
- 声表面波气体传感器阵列模式识别技术的研究,TP212
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|