学位论文 > 优秀研究生学位论文题录展示
多类小字符集自适应字符识别技术及系统的研究
作 者: 彭健
导 师: 黄尚廉
学 校: 重庆大学
专 业: 仪器科学与技术
关键词: 自适应字符识别 字符识别系统 表格识别 可变形模板 自动特征提取 神经网络
分类号: TP391.4
类 型: 博士论文
年 份: 2002年
下 载: 514次
引 用: 11次
阅 读: 论文下载
内容摘要
本文研究了多类小字符集自适应字符识别技术及系统实现。本项目的背景是基于手写体文字识别技术的铁路轮轴卡片(表格)光电录入系统。在该项目中,需要识别的字符比较多,包括英文大写字母、阿拉伯数字、一些专用符号、部分汉字,这些字符集可能发生变化,要求识别精度比较高。我们在对字符识别技术进行深入研究的基础上,采取了多种技术措施完成了研究任务。 在字符识别技术方面,我们研究了各种神经网络模型在字符识别中的应用原理,经过比较,我们选用多层前向网络作为候选的字符分类器。另一方面,子空间方法和神经网络一样,也是灵活构造字符分类器、实现自适应字符识别的一个有力的工具,具有训练和识别速度快、识别精度高的特点。我们研究了学习子空间方法的原理,对基本学习子空间算法进行了改进,提出了增强的拒识规则,并改进了Oja的子空间维数选择算法。 自动选择合适的特征和特征提取方法是实现自适应字符识别系统的关键之一。传统的字符识别系统的适应能力之所以比较差,就在于人的先验知识在选择特征的过程中影响太大。我们研究的重点在于如何在没有人的先验知识的情况下自动提取合适的字符特征。我们从两个方面研究了字符特征的自动提取的问题。 一个方面是通过学习发现字符的不变特征。我们研究了几种统计特征提取方法,和基于自适应子空间自组织映射(ASSOM)神经网络提取字符的特征提取方法。 关于字符特征提取的另一个方面,从大量的已有特征中选择对该字符集最合适的特征。我们研究了基于粗糙集的字符特征选择方法,对候选特征进行初步选择,去除明显对分类作用不大的特征,并提出了一种快速的粗糙集约简算法。在进行了初步的特征选择后,再利用主分量分析方法对特征进行进一步的降维处理,去除特征间的相关性。 除了上述基于学习的字符识别方法外,我们还对可变形模板字符识别技术进行了研究。可变形模板方法可以解决一些统计和神经网络识别方法不能解决的一些问题,其突出的优点在于能充分利用人对字符形状的先验知识,不需要用大量的字符样本进行训练,它对解决小字符集识 重庆大学博士学位论文别问题具有一定的什值。我在 Michael Revow和 Kwok-Wai Cheung等人的单笔划的数字识别研究的基础上,对他们的方法作了一定改进,将其.应用到多笔划的英文字母的识别上c 在实用系统的研究中,为了提高字符的识别率,我们提出了一种表格描述和智能分析方法,通过表格描述和定义,将较大的字符集按表格w’出肚’v曰H匕/‘”’/*’山’皿仕状’p’出心’*儿人”可认八*‘丁”卞’义从’订 上中不同的填写位置分解为一系列较小的字符集,从而大大提高了识别精度。这是一种非常有效而实用的方法。此外,在我们提出的表格描述和分析方法基础上,我们实现了一套智能表格分割算法,其中包括一种利用表格线的单色表格的快速分割算法c 如果用一个方法固定的宇符程序来识别程序来识别所有这些字符集显然不能得到好的识别效果,我们需要识别系统能根据不同的字符集的特点自动作相应的优化和调整。为了解决多个字符集识别器的设计问题,我们提出井实现了一个能自动根据所要识别的字符集选择最优识别方案的自适应字符识别系统。该系统在传统的神经网络和统计学习方法的基础上,通过一个自适应控制模块,使系统能根据要识别的字符集自动选择合适的识别方案。该模型的主要思想是: 将各种字符特征提取方法和分类器形成一个函数库,我们随时可以对这个函数库进行扩充c自适应控制模块从函数库中按一定的规则选取合适的特征提取函数和分类函数,然后对识别器的参数进行训练;随后用测试字符样本作自动作识别率测试并对测试结果作详细记录,自适应控制模块根据测试结果自动对特征提取和分类器方案作调整,这样大大减轻了设计者的工作量。我们实现了所提出的自适应字符识别系统模型,并在实用中取得了较好的效果c
|
全文目录
1 绪论 14-22 1.1 光学字符识别研究的对象及意义 14-15 1.2 光学字符识别的发展历史 15-16 1.3 自适应字符识别技术及现状 16-19 1.3.1 自适应字符识别 16-18 1.3.2 自适应字符识别技术 18-19 1.4 本文的研究的主要内容 19-21 1.5 本文的内容安排 21-22 2 神经网络技术在字符识别中的应用 22-40 2.1 引言 22-24 2.2 多层前向神经网络字符分类器 24-30 2.2.1 多层前向神经网络 24-26 2.2.2 BP网络分类器- 26-27 2.2.3 径向基函数(RBF)网络 27-28 2.2.4 BP网络与径向基函数网络的比较 28-30 2.3 反馈型神经网络 30-32 2.4 竞争型神经网络 32-35 2.4.1 无监督竞争学习 32 2.4.2 基本竞争型神经网络 32-33 2.4.3 抑制竞争型神经网络 33-34 2.4.4 自适应共振理论神经网络 34-35 2.5 自组织特征神经网络 35-40 2.5.1 SOM网络模型 35-37 2.5.2 SOM网络在字符识别中的应用 37-40 3 基于改进学习子空间方法的字符分类器 40-58 3.1 引言 40-41 3.2 模式子空间的基本概念及运算 41-44 3.2.1 模式子空间 41-42 3.2.2 矢量在子空间上的投影 42-43 3.2.3 子空间的正交补 43 3.2.4 子空间的变换 43-44 3.3 子空间分类器 44-46 3.4 子空间分类器的构造 46-52 3.4.1 非学习的子空间构造方法 46-47 3.4.2 基本学习子空间方法 47-49 3.4.3 平均学习子空间方法 49-51 3.4.4 学习子空间方法的前向神经网络模型 51-52 3.5 对子空间分类方法的改进 52-55 3.5.1 对Kohonen基本学习算法的改进 52-53 3.5.2 拒识规则 53-54 3.5.3 改进的子空间维数选择方法 54-55 3.6 识别实验 55-58 4 字符特征的自动提取方法 58-84 4.1 引言 58-60 4.1.1 特征提取的基本概念 58-59 4.1.2 特征的表达 59 4.1.3 特征提取与识别方法的关系 59-60 4.1.4 我们的工作方向 60 4.2 统计不变量特征 60-65 4.2.1 矩不变量特征 60-63 4.2.2 基于图像投影和变换的不变性特征提取方法 63-65 4.3 基于神经网络字符的特征的提取 65-69 4.3.1 概述 65-66 4.3.2 相关概念 66-68 4.3.3 ASSOM网络的学习 68-69 4.4 特征的选择和融合 69 4.5 模式可分性度量 69-71 4.5.1 模式空间中的距离度量与模式的散布矩阵 69-70 4.5.2 散度 70-71 4.6 特征选择的评价准则和算法 71-74 4.6.1 特征选择的评价准则 72-73 4.6.2 特征选择的常规算法 73-74 4.7 基于粗糙集理论的特征选择方法 74-78 4.7.1 粗糙集理论概述 74-75 4.7.2 特征集约简算法 75-78 4.8 主分量分析(PINCIPLE COMPONENT ANALYSIS)用于特征降维 78-81 4.9 主分量分析神经网络 81-84 5 基于可变形模板匹配的字符识别方法 84-102 5.1 引言 84-89 5.1.1 统计字符识别方法的不足 84-85 5.1.2 相关匹配方法 85-86 5.1.3 可变形模板匹配技术 86-89 5.2 字符模型的表示方法 89-93 5.2.1 字符模型的表达方法 89-91 5.2.2 字符模型的建立 91-93 5.3 可变形模板字符识别的Bayes理论 93-96 5.3.1 可变形模板字符识别的Bayes理论框架 93-94 5.3.2 匹配规则 94-96 5.4 模板与字符图像的匹配 96-100 5.5 实验结果 100-102 6 适应字符识别实用系统的研究 102-122 6.1 项目简介 102-103 6.2 表格的描述方法 103-105 6.3 智能表格版面分析及字符分割 105-115 6.3.1 概述 105-106 6.3.2 带定位标识的双色表格的版面分析 106-112 6.3.3 基于表格线的单色表格的版面分析方法 112-115 6.4 单个字符图像的预处理 115-117 6.4.1 字符的细化 115-116 6.4.2 字符图像大小的规范化 116-117 6.5 自适应字符识别器 117-122 6.5.1 识别器的结构 117-119 6.5.2 字符识别器的自动训练和调整 119-122 7 全文工作总结及继续研究的方向 122-126 致谢 126-128 参考文献 128-138
|
相似论文
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 红外超光谱图像的虚拟探测器研究,TP391.41
- 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
- 基于神经网络的水厂投药预测控制研究,TP273.1
- 视觉伺服四自由度机械臂的研究,TP242.6
- 机械臂视觉伺服系统的研究,TP242.6
- 压电驱动微工作台的控制与校正技术研究,TP273
- 某武器检测装置的控制系统设计,TP183
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 大学生综合素质测评研究,G645.5
- 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 基于神经网络辨识的同步发电机励磁控制研究,TM31
- 基于BP神经网络的水稻干燥智能控制研究,S226.6
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 海上平台消防系统研究,U698.4
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置
© 2012 www.xueweilunwen.com
|