学位论文 > 优秀研究生学位论文题录展示

街景影像的文字识别

作 者: 张凤
导 师: 杜明义
学 校: 北京建筑工程学院
专 业: 地图制图学与地理信息工程
关键词: 街景影像 文字识别 文字区域定位 人工神经网络
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 132次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算机技术的飞速发展,人类社会由工业化社会逐渐转变为信息化社会,信息化程度越来越高。伴随着互联网技术的发展,人们之间的信息传递不再靠纸质材料,所有文件都要转换为电子文档,这就为需要人们手工录入这些文字信息,为日常工作增添了大量的重复工作。为了提高人们日常工作的效率,让信息交流的更加流畅,文字识别技术日益受到众多学者的关注。同时,让计算机代替人类来完成这些重复性的工作就对计算机等辅助设备的智能程度提出了更高的要求。目前,计算机文字识别技术已经非常成熟,对于印刷体汉字,扫描文件的汉字,识别速度快,准确率高,极大的提高了我们的工作效率。移动道路测量系统是现代测绘行业的前沿技术,该系统解决了海量空间数据的存储和快速更新问题,更进一步要从这些海量数据中提取更多有用的信息。街景影像作为移动道路测量系统采集的基础数据之一,其包含了大量的文字信息,如果能自动的提取这些文字信息,对于信息的检索,兴趣点的搜索定位是非常有价值的。本文将空间信息技术和文字识别技术相结合,解决街景影像中文字识别问题。街景影像中文字信息背景复杂,在影像中的位置不确定,文字多为广告牌匾上的文字,艺术效果较多。要想识别文字,首先要确定文字的区域范围,本文提出了基于数学形态学分析和连通区域分析的文字区域定位方法,将文字从复杂背景中提取出来,为进一步的文字识别奠定良好的基础。文字识别属于模式识别的一种,模式识别理论是在计算机技术突飞猛进的基础上,研究人员深入研究人类的行为和思维模式所提出的一种识别方法。模式识别方法较多,人工神经网络模式识别打破的传统模式识别的方法,为模式识别开辟了一个新的研究方向。由于神经网络基于分式高速并行处理的工作原则,其具有很强的自学习能力,联想记忆能力,容错性,可扩展性,组织性等特性。因此,采用神经网络的文字识别方法,可以提高识别的质量并且识别比预定义字符更多的字符。本文采用的是单隐含层的BP神经网络文字识别对字符进行识别。实验结果表明,本文所提出的文字区域定位方法和神经网络文字识别方法可以较准确的将文字区域定位出来,对区域中文字基本都能识别出来。

全文目录


摘要  3-5
Abstract  5-7
目录  7-9
第1章 绪论  9-17
  1.1 概述  9-10
  1.2 文字识别发展历史和研究现状  10-12
    1.2.1 文字识别发展历史  10-12
    1.2.2 汉字识别的难点  12
  1.3 移动道路测量系统概述  12-15
    1.3.1 LD2000-RM 型移动道路测量系统介绍  13-14
    1.3.2 移动道路测量系统中 CCD 相机的工作模式  14
    1.3.3 街景影像文字信息提取的实用性  14-15
  1.4 街景影像中文字的特征  15
  1.5 本文组织结构  15-16
  1.6 本章小结  16-17
第2章 街景影像预处理  17-27
  2.1 预处理概述  17
  2.2 彩色图像灰度化  17-19
    2.2.1 分量法  17-18
    2.2.2 平均法  18
    2.2.3 最大值法  18
    2.2.4 加权平均法  18-19
  2.3 图像去噪处理  19-22
    2.3.1 邻域平均法  19-20
    2.3.2 中值滤波法  20-21
    2.3.3 高斯滤波  21-22
  2.4 二值化  22-25
    2.4.1 全局阈值法  22-24
    2.4.2 局部阈值法  24-25
  2.5 本章小结  25-27
第3章 街景影像文字区域定位  27-35
  3.1 文字区域定位概述  27
  3.2 文字区域定位方法  27-29
    3.2.1 基于连通区域的方法  27-28
    3.2.2 基于纹理分类的方法  28
    3.2.3 基于边缘检测的方法  28-29
  3.3 形态学分析  29-30
  3.4 基本连通区域分析  30-32
  3.5 投影分析调整文字区域  32-34
  3.6 本章小结  34-35
第4章 字符切分与归一化处理  35-39
  4.1 字符切分及归一化处理概述  35
  4.2 字符切分处理  35-37
    4.2.1 上下轮廓线  35-36
    4.2.2 字符切分  36-37
  4.3 归一化处理  37-38
  4.4 本章小结  38-39
第5章 街景影像文字识别  39-55
  5.1 文字识别概述  39
  5.2 文字特征提取  39-42
  5.3 文字识别的方法  42-45
    5.3.1 结构模式识别  42-43
    5.3.2 统计模式识别  43-44
    5.3.3 统计识别与结构识别的结合  44-45
    5.3.4 人工神经网络  45
  5.4 BP 神经网络  45-47
  5.5 街景影像中的文字识别  47-54
    5.5.1 文字识别流程  47
    5.5.2 特征提取  47-48
    5.5.3 神经网络训练样本  48-51
    5.5.4 实验结果及分析  51-54
  5.6 本章小结  54-55
结论与展望  55-57
  1 结论  55
  2 展望  55-57
参考文献  57-59
致谢  59

相似论文

  1. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  2. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  3. 兖州矿区植物波谱变异与重金属胁迫特征研究,X173
  4. 企业安全效益评价及发展对策研究,F272;F224.5
  5. 酮类化合物的3D-QSPR研究,O641
  6. 基于遗传算法的前馈神经网络优化研究,TP183
  7. 人类抗原肽载体结合力预测,R392.1
  8. 基于智能计算的网络学习评价模型研究与系统设计,TP18
  9. 基于小波神经网络模型的短期汇率预测,F224
  10. 基于改进BP网络的软件项目风险评价研究,TP183
  11. 铁法晓明矿瓦斯灾害预测,TD712
  12. 基于纹理特征的煤炭发热量研究,TP391.41
  13. 基于粒子群优化神经网络的电力短期负荷预测研究,TM715
  14. ANN在海州露天矿区地下水水质评价与预测中的应用,X824
  15. 多模型阶梯式广义预测控制策略研究,TP273
  16. 基于人工智能的上皮性卵巢癌预后模型的研究,R737.31
  17. 控制机器臂运动的表面肌电信号变换规律的研究,TN911.7
  18. 中小型水库洪水优化调度,TV697.13
  19. 小型力矩陀螺的电磁兼容分析和齿槽转矩研究,TN03
  20. 汽车轮胎表面标识识别系统的设计与研究,TP391.41
  21. 直升机主减速器故障诊断与故障预测技术研究,V267

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com