学位论文 > 优秀研究生学位论文题录展示

生物视觉启发的图像识别技术研究

作　者: 孟祥林
导　师: 王正志
学　校: 国防科学技术大学
专　业: 控制科学与工程
关键词: 图像识别生物视觉认知心理学目标识别场景识别视觉掩蔽效应视觉注意自适应共振理论
分类号: TP391.41
类　型: 博士论文
年　份: 2011年
下　载: 102次
引　用: 0次
阅　读: 论文下载

内容摘要

图像识别是当前视觉领域的研究热点，其根本任务是借助计算机对图像所包含的场景或目标进行分类和辨识，在基于内容的图像检索、智能环境感知、军事目标识别等领域有着广泛的应用前景。传统的工程方法能够较好的处理结构化环境中的视觉识别任务，但在应对非结构化的自然场景分类和目标识别问题时会遇到很大的困难，有很多问题亟待解决，诸如：如何减弱甚至消除环境中的噪声、光照、遮挡等不确定因素的影响，实现自然图像的稳定感知；如何有效捕获图像的全局信息，实现快速的场景感知分类；如何将视觉注意机制融入图像识别过程，提高图像目标识别的性能等。本文以自然图像为研究对象，借鉴人类的视觉感知机理，结合大脑视皮层的生理结构和功能以及认知心理学的相关实验结论，围绕自然图像识别的上述问题开展了一些探索性研究，完成的主要工作如下：前注意的边界和表面感知：研究了如何鲁棒地检测自然图像的边界轮廓，以及在不同的光照条件下，如何稳定感知物体的表面亮度。本文主要针对Grossberg的BCS/FCS神经模型在处理自然图像时存在的问题进行了分析，提出了相应的改进和优化方案，使得自然图像的轮廓检测不受噪声和小范围遮挡的影响，增强了鲁棒性；表面亮度感知克服了原模型存在的亮度信息丢失、表面雾化、边缘模糊等问题，可以有效恢复物体表面的感知亮度，而且对于光照变化不敏感。此外，受表面恢复过程的神经元活性扩散机制和认知心理学启发，提出一种基于视觉掩蔽效应的图像扩散算法，可以在滤除噪声的同时有效地保留图像的重要结构特征。场景的快速感知分类：提出一种场景全局特征描述方法，能够捕获场景的全局结构特性，包含了场景中大致的几何信息，与人类通过快速获取场景的空间布局结构信息判断其语义内容的心理学观点一致，同经典的SIFT特征描述方法相比，更适合于场景图像的识别。该方法简单易实现，计算速度快。视觉空间注意机制建模：提出一个基于认知心理学和生理学的视觉注意计算模型。将输入图像映射到心理视觉空间，然后在每个特征图上构建一个全连接图，并利用基于图方法的随机游走模拟视皮层神经元间的信息传递，依据信息最大化原则和特征整合理论生成最终的显著图，模型在感兴趣区域检测和人眼注视预测方面优于现有模型。此外，场景信息对于目标的选择注意具有指导作用，结合本文提出的场景全局特征描述方法，建立了空间注意的上下文引导模型，引入自顶向下的注意调制机制，对于任务相关的主动视觉搜索过程具有较好的预测性能。引入注意机制的目标识别：将视觉注意机制融入目标识别过程，构建了一个基于注视转移的目标识别框架：NIMART。模拟人类在目标学习和识别过程中的注视转移，利用注意生成的显著图指导眼动，并考虑了注视转移过程中的返回抑制机制，利用自适应共振理论对提取的注视区域特征进行学习和决策。NIMART符合人脑学习和识别目标的机理，在通用图像数据集上的实验表明模型具有良好的目标识别性能。

全文目录

摘要  11-13
Abstract  13-15
第一章绪论  15-25
  1.1 研究背景  15-16
  1.2 图像识别的技术挑战  16
  1.3 生物视觉感知机制相关研究  16-22
    1.3.1 视觉通路理论研究  17-18
    1.3.2 视觉感知不变性研究  18-19
    1.3.3 视觉特征组织的研究  19-20
    1.3.4 视觉注意机制研究  20-22
  1.4 研究内容和创新点  22-24
  1.5 论文的章节安排  24-25
第二章边界和表面感知的神经动力学模型  25-49
  2.1 引言  25
  2.2 基于主导拮抗抑制机制的轮廓检测  25-37
    2.2.1 BCS 模型简介  25-26
    2.2.2 改进模型描述  26-33
    2.2.3 主导拮抗抑制机制的数学分析  33-34
    2.2.4 实验结果及讨论  34-37
  2.3 自然图像的亮度感知  37-48
    2.3.1 亮度感知概念描述  37-38
    2.3.2 自然图像的亮度感知模型  38-44
    2.3.3 实验结果及讨论  44-48
  2.4 本章小结  48-49
第三章基于视觉掩蔽效应的图像扩散  49-59
  3.1 图像扩散的相关研究  49-50
  3.2 视觉掩蔽效应  50
  3.3 基于视觉掩蔽效应的图像扩散算法  50-55
    3.3.1 各向异性扩散  50-51
    3.3.2 非均质性度量  51-53
    3.3.3 噪声可见度函数及扩散方程  53-54
    3.3.4 算法描述  54
    3.3.5 稳定性分析  54-55
  3.4 实验结果和讨论  55-58
    3.4.1 评价方法  55
    3.4.2 实验结果  55-58
  3.5 本章小结  58-59
第四章场景的快速感知分类  59-81
  4.1 引言  59-61
    4.1.1 场景识别的概念  59-60
    4.1.2 场景识别的意义  60-61
    4.1.3 场景识别的特点  61
  4.2 场景识别的相关研究  61-66
    4.2.1 基于低层特征的表达方法  62-63
    4.2.2 中层语义建模方法  63-64
    4.2.3 基于局部子块的中层表达建模  64-65
    4.2.4 生物视觉启发的方法  65-66
  4.3 场景特征描述方法  66-71
    4.3.1 场景识别的要素  66-67
    4.3.2 特征提取方法  67-71
  4.4 实验和讨论  71-79
    4.4.1 测试数据集  71-73
    4.4.2 实验结果和分析  73-79
    4.4.3 结论  79
  4.5 本章小结  79-81
第五章视觉空间注意机制建模  81-107
  5.1 引言  81-82
  5.2 自底向上的视觉注意模型  82-98
    5.2.1 相关研究  82-85
    5.2.2 一种自底向上的视觉注意模型  85-92
    5.2.3 模型性能评估  92-98
  5.3 融入自顶向下知识的注意模型  98-106
    5.3.1 相关研究  98-99
    5.3.2 空间注意的上下文引导模型  99-102
    5.3.3 实验和讨论  102-106
  5.4 本章小结  106-107
第六章引入注意机制的目标识别  107-123
  6.1 引言  107
  6.2 皮层目标识别的相关研究  107-110
    6.2.1 目标识别的生理基础  107-108
    6.2.2 生物视觉目标识别计算模型  108-109
    6.2.3 存在问题及改进方法  109-110
  6.3 自适应共振理论简介  110-116
    6.3.1 ART 的工作原理  111-112
    6.3.2 Default ARTMAP2 算法描述  112-116
  6.4 引入注意机制的目标识别建模  116-121
    6.4.1 模型描述  116-119
    6.4.2 实验设计和参数选择  119
    6.4.3 实验结果和分析  119-121
  6.5 本章小结  121-123
第七章结束语  123-127
  7.1 论文工作总结  123-124
  7.2 未来工作展望  124-127
致谢  127-129
参考文献  129-141
作者在学期间取得的学术成果  141

生物视觉启发的图像识别技术研究

内容摘要

全文目录

相似论文