学位论文 > 优秀研究生学位论文题录展示

基于CPN的视频人工文本提取方法研究

作 者: 刘大方
导 师: 王燕
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 视频 文本定位 切片 神经元 CPN
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 6次
引 用: 0次
阅 读: 论文下载
 

内容摘要


视频中人工文本是由制作人员在影片制作后期手工添加的,用来补充说明图像内容的文本字符。人工文本与图像内容的联系紧密,使得它对图像内容的说明以及检索有着十分重要的意义,因此视频中人工文本的提取与识别成为当前的研究热点。本文在对现有视频文本提取方法研究的基础上,针对解决视频图像低分辨率、定位提取速度慢、特征提取方法复杂等问题,给出一种基于对偶传播神经网络(CPN)的视频人工文本提取方法。首先,针对目前存在的视频文本提取方法自动化程度较低、网络输入特征提取方法复杂、训练样本集制作困难的问题,提出了对视频帧进行分割切片,直接以切片区域像素原始灰度值作为CPN输入的方法;其次,针对CPN在模式分类方面的优势,重点研究了CPN的结构算法和特点,以部分优选的输入样本初始化输入层与竞争层连接权值矩阵、以期望输出直接对竞争层与输出层的连接权值矩阵赋值的方法,结合竞争层神经元获胜次数限定,解决了网络“死神经元”问题,同时也使训练速度大大加快,网络性能进一步提高;然后,利用设计的限定性CPN对视频帧文本进行初步定位,并根据距离关系进行组合,得到初步文本区域;最后,采用图像增强技术和形态学方法对初步定位的文本区域进行降噪和增强处理。实验表明,论文提出的方法算法简单,性能良好,速度很快,实现了以简单方法解决复杂问题的目的。

全文目录


摘要  5-6
Abstract  6-9
第1章 绪论  9-14
  1.1 课题的研究背景及意义  9-10
  1.2 国内外主要研究现状  10-12
  1.3 课题的研究内容  12
  1.4 论文的组织结构  12-14
第2章 视频文本提取技术总结研究  14-34
  2.1 视频文本的特点  14-16
  2.2 视频文本提取系统  16-17
  2.3 文本定位方法研究与分析  17-23
    2.3.1 基于特征的方法  17-22
    2.3.2 基于学习的方法  22-23
  2.4 边缘算子概述  23-29
  2.5 图像后期处理方法分析  29-33
  2.6 本章小结  33-34
第3章 限定性 CPN 的设计  34-44
  3.1 CPN 简介和体系结构  34-40
    3.1.1 神经网络的学习方法  34-35
    3.1.2 CPN 的拓扑结构和学习算法  35-37
    3.1.3 CPN 研究和应用现状  37-39
    3.1.4 CPN 的特点  39-40
  3.2 限定性 CPN 的结构和学习规则  40-42
  3.3 限定性 CPN 的学习算法  42-43
  3.4 本章小结  43-44
第4章 性能分析  44-53
  4.1 实验主要工作  44
  4.2 样本集的构建  44-45
  4.3 文本区域定位  45-47
    4.3.1 网络的训练  45-46
    4.3.2 文本区域定位  46-47
  4.4 LCPN 性能分析  47-52
    4.4.1 性能分析指标  47-49
    4.4.2 LCPN 各项性能指标及影响指标的因素分析  49-52
  4.5 本章小结  52-53
结论  53-54
参考文献  54-59
致谢  59

相似论文

  1. GJB1188A接口监测记录设备研制,V248.2
  2. 船用舵机电液伺服单元单神经元PID控制,U666.152
  3. 基于率失真优化的码率控制算法研究,TN919.81
  4. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  5. 基于仿生模式识别的文本分类技术研究,TP391.1
  6. SIP协议研究及其在视频通信中的应用,TP393.04
  7. ML模型下耦合可兴奋系统的动力学研究,Q42
  8. 高校精品课程视频资源应用现状与对策研究,G642.3
  9. 面向公众的教育视频共建共享平台的设计与实践研究,G434
  10. 基于Web的课堂教学视频分析与诊断系统的设计与实现,TP393.09
  11. 联合检测血清TPS,CEA,CYFRA21-1,NSE在肺癌诊断中的临床价值,R734.2
  12. 基于程序切片的电子海图系统软件测试技术研究,TP311.53
  13. 猪FTO的组织特异性表达及其调控,S828
  14. 氯通道阻断剂对一氧化氮诱导培养大鼠海马神经元凋亡的影响,R363
  15. EAN脑保护与脑损伤修复三细胞模型系统中的内皮细胞及神经元形态特征,R651.1
  16. 全乳腺大切片观察乳腺癌新辅助化疗后残留灶形态学变化及部分分子生物学特点研究,R737.9
  17. 小电导钙激活性钾通道在阿尔茨海默病小鼠中的作用,R749.16
  18. 基于运动目标轨迹分析的智能交通监控系统,TP277
  19. 分布式多视点视频编码容错边信息与相关噪声模型研究,TN919.81
  20. 网格任务调度算法研究及其有色Petri网的建模与仿真,TP301.1
  21. 井下搜救机器人音视频采集传输研究与实现,TP274.2

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com