学位论文 > 优秀研究生学位论文题录展示

基于人眼视觉模型的自然图像识别

作 者: 郑桂芳
导 师: 练秋生
学 校: 燕山大学
专 业: 电路与系统
关键词: 视觉系统 视觉模型 双树复数小波 Marr-like金字塔 log-gabor小波
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 53次
引 用: 0次
阅 读: 论文下载
 

内容摘要


人类视觉系统是世界上最好的目标识别系统,能够轻易的从复杂的外界环境当中获取有用的信息,研究者试图将生物视觉系统的特性融入到计算机视觉当中,建立符合视觉信息处理过程的模型,为计算机视觉的发展提供了一种新的思路。目前研究者已经提出了很多有关的视觉模型,但大部分不能很好的模拟视觉系统进行信息处理的各个过程。其中Serre的标准模型是性能较好的模型,本文在此模型的基础上对其进行改进,以构建出更加符合生物特性的性能良好的视觉模型。本文首先研究了有关视觉皮层生理特性的基本知识,分析了目前比较成功的几个视觉模型,在标准模型的基础上,采用具有近似平移不变性并且冗余度较小的双树复数小波对其进行改进,在识别率和计算速度上都有一定程度的提高,结合Jim Mutch提出的稀疏化方法对模型进行优化,去掉大量冗余信息。其次,在标准模型的基础上加入神经元激活机制来代替最大化方法,提出一种新的视觉模型—EAM模型,结合具有尺度不变性和平移不变性的Marr-like金字塔和复数小波、特征局部性等理论,对原始模型进一步改进,获得具有局部不变性的特征。最后,采用更加接近人类视觉特性的log-gabor小波,结合Dirk Walther提出的自上而下视觉注意机制构建一个反馈模型,将注意力集中到与目标相关的特征上,去掉背景造成的干扰信息。最后,通过采用Caltech数据库中的图片,将改进模型与标准模型进行分类任务的性能比较,实验表明,改进模型在识别率和运算速度上都有不同程度的改善。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-18
  1.1 课题研究背景  10-12
  1.2 国内外发展现状  12-15
  1.3 课题研究的意义  15-16
  1.4 课题研究内容  16-17
  1.5 本文组织结构  17-18
第2章 基于复数小波和稀疏化特征的视觉模型  18-40
  2.1 生物视觉感知系统基础  18-23
    2.1.1 视皮层的分层结构  19-21
    2.1.2 感受野  21-23
  2.2 生物视觉模型  23-30
    2.2.1 HMAX 模型  24-25
    2.2.2 Serre标准模型  25-26
    2.2.3 基于标准小波的视觉模型  26-28
    2.2.4 Jim Mutch的分层模型  28-30
  2.3 基于DTCWT和稀疏化特征的视觉分层模型  30-35
    2.3.1 复数小波  31-32
    2.3.2 基于DTCWT的分层模型  32-34
    2.3.3 稀疏化特征在DTCWT分层模型的应用  34-35
  2.4 实验结果及分析  35-39
    2.4.1 基于DTCWT的分层模型实验分析  36-37
    2.4.2 基于稀疏化特征的DTCWT分层模型实验分析  37-39
  2.5 本章小结  39-40
第3章 基于神经元激活机制的视觉模型  40-52
  3.1 基于神经元激活机制的视觉模型(NAM模型)  40-43
  3.2 基于Marr-like金字塔的NAM模型  43-48
    3.2.1 Marr初级视觉理论  43-44
    3.2.2 Marr-like小波金字塔  44-45
    3.2.3 小波主要素(Primal Sketch)  45-47
    3.2.4 基于Marr-like金字塔的NAM模型  47-48
  3.3 基于DTCWT的NAM模型  48-49
  3.4 实验结果及分析  49-51
    3.4.1 基于DTCWT的NAM模型  49-50
    3.4.2 基于Marr-like金字塔的NAM模型  50-51
  3.5 本章小结  51-52
第4章 基于生物反馈机制的视觉模型  52-62
  4.1 引言  52-53
  4.2 Hamada 的生物视觉模型  53-54
  4.3 反馈模型  54-56
  4.4 视觉注意机制  56-57
  4.5 Log-Gabor函数  57-59
  4.6 实验结果及分析  59-61
    4.6.1 基于DTCWT的反馈模型  59-60
    4.6.2 基于Log-Gabor小波的反馈模型  60-61
  4.7 本章小结  61-62
结论  62-64
参考文献  64-68

相似论文

  1. 图像的稀疏表示及编码模型研究,TP391.41
  2. 基于H.264/AVC可分级视频编码算法的研究,TN919.81
  3. 基于人类视觉特性的结构相似度图像质量评价,TP391.41
  4. 基于神经网络的数字水印算法的研究与实现,TP309.7
  5. 内源光学与微电极视觉实验平台设计,TP391.41
  6. 基于视觉特性及人工神经网络的图像压缩,TP391.41
  7. 基于神经网络后处理的数字水印算法,TP309.7
  8. 基于感知模型的鲁棒图像水印技术研究,TP309.7
  9. 高辐射分辨率遥感影像数字水印算法研究,TP309.7
  10. 文本图像信息隐藏技术研究,TP391.41
  11. 分形图像编码及其在信息隐藏中的研究与应用,TN919.81
  12. 结合人眼视觉特性和TV模型的图像去噪方法研究,TP391.41
  13. 自适应光学图像复原算法研究,TP391.41
  14. 基于相关性分析的网络生物认证方法研究,TP309
  15. 图像数字水印算法研究,TP309.7
  16. 基于DCT的块效应消除算法研究,TP391.41
  17. 基于DCT的鲁棒性数字水印算法,TP309.7
  18. 基于图像特征的信息隐藏算法研究,TP391.41
  19. 封装设备视觉系统软件包的设计,TP311.52
  20. 基于DCT域的自适应盲数字水印算法研究,TP309.7
  21. 基于CDMA的图像数字水印算法的研究,TP309.7

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com