学位论文 > 优秀研究生学位论文题录展示

对利用边界标定自动机进行文档图像分析的研究

作 者: 王涤琼
导 师: 顾国庆
学 校: 华东师范大学
专 业: 系统分析与集成
关键词: OCR 顶点链编码 边界标定自动机 倾斜校正 鲁棒回归 版面分析 版面识别 版面理解 游长平滑处理 连通体 最小外接矩形 密集度 体态比
分类号: TP391.41
类 型: 硕士论文
年 份: 2005年
下 载: 129次
引 用: 0次
阅 读: 论文下载
 

内容摘要


文档图像分析是光学字符识别(OCR)技术的重要组成部分。本文在对顶点链编码深入研究的基础上,设计并实现了利用边界标定自动机进行文档图像倾斜校正版面分析连通体几何特征提取的方法。边界标定自动机是一套能对数字图像中的目标对象进行边界标定并生成对应的顶点链编码的技术,作者首次将这一技术应用于文档图像分析,其中,根据输出的顶点链编码得到文档图像中所有连通体的外接矩形并相应进行对整幅图像的文本行判断以实现倾斜角度探测和版面分析均属本文的创新之处。同时,作者通过大量实验,证明了本算法在实际应用中的可行性和有效性。

全文目录


摘要  5-6
Abstract  6-9
第一章 研究背景及研究内容  9-14
  1.1 研究背景及意义  9
  1.2 文档图像分析的研究现状  9-12
  1.3 论文的主要内容、贡献及创新点  12-14
第二章 顶点链编码技术  14-18
  2.1 顶点链编码  14-16
  2.2 顶点链编码的特性  16-18
第三章 边界标定自动机  18-24
  3.1 正方形点阵二值图像的标定  18-21
  3.2 正三边形点阵二值图像的标定  21-22
  3.3 正六边形点阵二值图像的标定  22-24
第四章 利用边界标定自动机进行文档图像倾斜校正  24-40
  4.1 基本原理  25-26
  4.2 边界标定  26-27
  4.3 文本行判断  27-36
  4.4 拟合倾斜角度  36-37
  4.5 实验和结论  37-40
第五章 基于边界标定自动机的版面分析算法  40-58
  5.1 版面及版面的分类  40-43
  5.2 基于边界标定自动机的版面分析算法  43-58
第六章 利用边界标定自动机对图像几何特征的提取  58-64
  6.1 利用边界标定自动机对图像几何特征的提取  58-60
  6.2 几何特征在文档图像分析中的应用  60-62
  6.3 实验结果和结论  62-64
第七章算法实现系统  64-69
  7.1 系统开发环境  64
  7.2 系统开发方法和数字图像的存储方式  64-67
  7.3 系统结构  67-69
第八章 总结和展望  69-71
  8.1 总结  69
  8.2 展望  69-71
参考文献  71-74
附录  74-75
致谢  75

相似论文

  1. 数字图像中文字移除和修复系统的设计和实现,TP391.41
  2. 地震图数字化中波形校正与跟踪方法的研究,TP391.41
  3. 文档图像的版面分析技术研究,TP391.41
  4. 实时车牌分割与识别技术研究,TP391.41
  5. 车牌字符自动识别方法的研究,TP391.41
  6. 基于OCR的支票识别系统的研究与实现,TP391.41
  7. 基于图像处理的丝印质量监控系统,TP391.41
  8. 印刷体数学公式中矩阵结构分析方法的研究,TP391.4
  9. 一种定位中文印刷体文档中数学表达式的方法,TP391.4
  10. 商业银行远程监督系统研究和开发,F832.2
  11. 基于复杂度的自适应中文版面分析方法研究,TP391.1
  12. 车牌识别系统的主要技术研究,TP391.41
  13. 车牌自动识别算法的研究与实现,TP391.41
  14. 基于AdaBoost算法的车牌识别研究,TP391.41
  15. 东盟一体化对中国对外贸易的影响,F752.7
  16. 车标定位技术研究,TP391.41
  17. 基于非结构化P2P系统的搜索算法研究,TP391.3
  18. 屏幕软键盘自动识别技术研究,TP391.41
  19. 文本图像中Logo检测与识别技术的研究,TP391.41
  20. 基于模型驱动的表格识别的研究,TP391.41
  21. 印刷体中文文档中表格和汉字的识别研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com