学位论文 > 优秀研究生学位论文题录展示

弯曲书页图像处理方法及在古籍数字化中的应用

作 者: 刘一斐
导 师: 张朋
学 校: 首都师范大学
专 业: 应用数学
关键词: 文档数字化 弯曲变形 边缘三维重构 直线线性插值 古籍
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 63次
引 用: 0次
阅 读: 论文下载
 

内容摘要


文档数字化在日常工作和生活中的应用日趋广泛。非接触式的文档数字化方法如数码照相凭借其设备便携、操作简便、成本低廉、不对原纸质文档造成任何损伤等优势,在文档数字化领域尤其是珍贵古籍的数字化领域的应用日趋广泛。但是在对纸质文档尤其是厚重古籍书页拍照时,书页图像将不可避免的出现一定程度的弯曲变形,必须对其加以矫正,才能进行OCR(Optical CharacterRecognition光学字符识别)、归档等文档数字化的后续工作。本文针对这一问题,提出一种切实高效的弯曲书页图像的图像矫正处理算法。在本文的研究中,详细分析了目前国内外在该领域的各种处理算法,包括将弯曲书页的几何形状建立为规则柱面模型、推广柱面模型、Ruled Surface模型等数学模型,从而找到变形图像上与真实书页上点对点的映射关系的方法;也包括使用CT、投影仪等设备得到弯曲书页变形的深度信息,再通过质量-弹簧模型将其退化为平面的方法。但是这些方法或是受到被矫正页面内容的限制、或是需要大量手工操作、或是依赖于特殊设备,在算法应用的普及性和高效性上存在一定的问题。本文提出一种基于边缘线的三维重构实现弯曲矫正的方法。这种方法将弯曲书页的几何形状建立为具有一定普适性的推广柱面模型,基本原理为首先提取出弯曲书页图像中的书页边缘线;而后根据实际书页高度、拍摄高度、拍摄焦距等简单易得的参数,通过几何成像的理论恢复书页图像中书页边缘的三维形状,从而得到图像上弯曲书页边缘线上任意一点到书页中缝起点的真实距离;进一步在推广的柱面模型上,直接采用简便的直线线性插值方法,得到弯曲书页图像上所有点与真实位置点的映射关系,从而实现矫正。本文的方法所用的特征信息来自页面边缘,不依赖于被矫正页面的内容;仅需要一些基本的拍摄参数,无需手工操作;采用直线线性插值方法即可获得点对点映射关系,运算量很小。本文随后选取一些弯曲古籍书页图像进行了算法实现和实验研究。实验结果表明,本文提出的基于边缘线的三位重构弯曲矫正方法不仅高效快捷,而且能够保证较好的矫正精度,具有一定的实用价值。

全文目录


摘要  4-5
Abstract  5-9
第1章 引言  9-16
  1.1 本文的研究背景及意义  9-11
  1.2 本文的主要工作  11-14
  1.3 本文的结构安排  14-16
第2章 弯曲变形矫正的研究现状  16-29
  2.1 弯曲变形矫正的研究现状  16-27
    2.1.1 规则的柱面模型  16-18
    2.1.2 推广的柱面模型  18-19
    2.1.3 Ruled Surface模型方法  19-24
    2.1.4 纸面任意变形的模型  24-27
  2.2 本文的思想方法  27-29
第3章 基于边缘线三维重构的弯曲矫正方法原理  29-38
  3.1 文档图像边缘的三维重构  29-36
    3.1.1 图像二值化  29-31
    3.1.2 边缘跟踪  31-32
    3.1.3 边缘曲线的三维重构  32-36
  3.2 文档图像弯曲变形的矫正  36-37
    3.2.1 弯曲文档图像与矫正图像点对点映射关系的建立  36-37
    3.2.2 图像矫正  37
  3.3 算法流程  37-38
第4章 弯曲古籍文档图像矫正实验研究及结果评价  38-51
  4.1 实验环境  38-39
  4.2 算法实现环境及程序框架  39-40
  4.3 实验过程及实验结果  40-48
  4.4 矫正效果评价  48-51
第5章 总结和展望  51-52
参考文献  52-55
致谢  55

相似论文

  1. 汉文古籍标准化元数据转换研究与应用,TP391.1
  2. 明清医家郁证方药使用规律探析,R249
  3. 黄永年文献学思想研究,G256
  4. 高校图书馆古籍保护与专业人员培训对策研究,G251.6
  5. 中国古籍丛书目录编纂研究,G256
  6. 天一阁历史档案与相关史料开发研究,G259.29
  7. 河南古籍的开发与利用研究,G255.1
  8. 浙江古代丛书述论,G256
  9. 蒙古文古籍出版技术的演变之探索,H212
  10. 历代蒙文译著的序跋研究,K28
  11. 商务印书馆古籍出版研究,G239.2
  12. 基于地面示功图对抽油杆与油管偏磨的诊断研究,TE355.5
  13. 《汉书》成语研究,H131
  14. 钢筋混凝土柱非线性变形分解试验及模拟,TU375.3
  15. 紫癜古籍文献统计分析研究,R259
  16. 建国以来云南省少数民族古籍工作述论,G255.1
  17. 基于可见水印的古籍图像版权保护技术研究,TP309.7
  18. 基于轴类零件的动态自动测量及误差校正方法的理论分析,TG80
  19. RBAC模型在数字化科技文档管理平台中的应用研究,TP309
  20. 以《四库全书》和《四部丛刊》电子版分析看我国古籍数字化的发展趋势与研究综述,G255.1
  21. 轴类零件弯曲变形在线检测研究,TP274

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com