学位论文 > 优秀研究生学位论文题录展示

基于注意力选择机制的图像分割与场景理解

作　者: 李青山
导　师: 周越
学　校: 上海交通大学
专　业: 控制工程
关键词: 场景理解图像分割显著性检测 GrabCut 主题模型
分类号: TP391.41
类　型: 硕士论文
年　份: 2012年
下　载: 383次
引　用: 1次
阅　读: 论文下载

内容摘要

场景理解作为计算机视觉的目标之一多年一直来被广泛研究。狭义上讲,场景理解即是让计算机理解一幅图片的内容,诸如图像分割、物体识别等研究即是在向这个方向努力。随着近年来电子产品和互联网技术的飞速发展,图片的内容也越来越多样化,从而引出了广义上的场景理解:对图片主题的理解。长期以来图像显著性检测与分割、场景理解(场景分类、语义标注)被视为计算机视觉领域中的两个相对独立的问题。近年来,生理学实验表明:生物视觉系统依赖于选择性注意力,结合视觉记忆,快速理解场景内容,即图像显著性,视觉记忆以及场景语义理解与联想是紧密相关的。受此视觉认知机理启发,本文基于图像显著性,结合语意数据库的图像场景信息理解与联想计算模型:利用视觉注意力选择机制、视觉感知组织机制,即视觉显著性、区域分割模型,初步筛选、精确提取场景关键语义单元;利用视觉信息的联想记忆机制,即近似场景的语义知识迁移,标注关键语义单元;从而进一步利用概率图模型处理场景语义单元与语义主题的理解与联想过程。本文研究的难点在于如何使计算机能够从人的认知角度理解图像的语义信息,有效辨别图像场景类自身变化及各场景类之间的相似性。本文通过显著性语义建模、场景关键语义单元标注、场景主题精确建模,在弥合图像低层特征和高层语义之间的语义鸿沟方面做出了有效的研究。

全文目录

摘要  5-7
ABSTRACT  7-15
第一章绪论  15-25
  1.1 场景理解研究现状  17-19
    1.1.1 场景分类  17
    1.1.2 物体识别  17-18
    1.1.3 场景分析  18-19
  1.2 显著性检测研究现状  19-20
    1.2.1 自底而上的显著性检测方法  19-20
    1.2.2 自顶向下的显著性检测方法  20
    1.2.3 综合性显著性检测方法  20
  1.3 图像分割研究现状  20-22
    1.3.1 传统的图像分割方法  21
    1.3.2 基于水平集的图像分割  21
    1.3.3 基于MRF 的图像分割  21-22
  1.4 图像标注研究现状  22
  1.5 基于注意力选择机制的场景分类系统  22-23
  1.6 本文的研究内容和组织结构  23-25
第二章基于显著性检测的场景图片预处理  25-38
  2.1 Itti’s 显著性特征检测  25-28
  2.2 基于图的显著性检测（GBVS）  28-29
    2.2.1 马尔可夫链的定义  28
    2.2.2 GBVS  28-29
  2.3 基于频域信息的显著性检测  29-31
  2.4 基于稀疏编码的显著性检测  31-33
    2.4.1 稀疏编码  31-32
    2.4.2 时空域中心邻域结构  32-33
  2.5 改进的基于稀疏编码的显著性检测模型  33-34
    2.5.1 模型建立  33-34
    2.5.2 显著性物体判定  34
  2.6 实验设置及结果分析  34-37
    2.6.1 实验设置  34-35
    2.6.2 实验结果分析  35-37
  2.7 本章小结  37-38
第三章自然场景中的多目标提取  38-58
  3.1 马尔可夫随机场模型  38-41
    3.1.1 MRF 与邻域系统  38-39
    3.1.2 Gibbs 随机场及Markov-Gibbs 等价性  39-40
    3.1.3 基于MRF 的图像分割理论框架  40-41
  3.2 MRF 模型的解法  41-46
    3.2.1 基于图割(Graph-Cut)的方法  41-43
    3.2.2 GrabCut  43-46
  3.3 基于IOR 选择机制的多目标提取  46-47
  3.4 基于轮廓信息的图像边缘修正  47-51
    3.4.1 P_b轮廓检测  48-51
    3.4.2 基于轮廓信息的图像分割的进一步校正  51
  3.5 基于显著性及MRF 的多目标图像分割  51-52
  3.6 实验结果及分析  52-57
    3.6.1 实验设置  52
    3.6.2 实验结果及分析  52-57
  3.7 本章小结  57-58
第四章基于局部特征和物体检测的图像标注  58-73
  4.1 局部特征提取  58-61
    4.1.1 Harris 角点检测  58-60
    4.1.2 DOG 算子  60-61
  4.2 场景图像的局部特征描述  61-64
    4.2.1 SIFT 局部特征描述  61-63
    4.2.2 SURF 局部特征描述  63-64
  4.3 利用物体滤波器做图像标注  64-66
    4.3.1 什么是物体滤波器  65-66
    4.3.2 物体滤波器的选择  66
  4.4 实验结果及分析  66-72
    4.4.1 实验设置  66-68
    4.4.2 基于图像分割的初步标注  68-70
    4.4.3 基于物体检测的进一步标注  70-72
  4.5 本章小结  72-73
第五章场景分类  73-91
  5.1 利用GIST 进行场景分类  73-76
  5.2 空间金字塔匹配算法（SPM）  76-79
  5.3 基于概率生成模型的场景分类  79-87
    5.3.1 模型概念  79-82
    5.3.2 种典型的概率图模型  82-84
    5.3.3 LDA 模型的参数估计和推理  84-87
  5.4 实验设置与结果分析  87-90
    5.4.1 实验设置  87-88
    5.4.2 实验结果与分析  88-90
  5.5 本章小结  90-91
第六章总结与展望  91-92
  6.1 主要工作和创新点  91
  6.2 后期工作  91-92
参考文献  92-95
致谢  95-96
攻读硕士学位期间已发表或录用的论文  96

相似论文

森林防火系统中图像识别算法的研究,TP391.41
数字图像处理在集装箱检测中的应用研究,TP274.4
个性化人工膝关节设计及其生物力学特性研究,R318.1
基于图像处理技术的烟叶病害自动识别研究,S435.72
红外图像目标识别及跟踪技术研究,TP391.41
细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
指纹图像分割方法评价与半监督学习在指纹图像分割中的应用研究,TP391.41
隐马尔可夫模型在视频场景分析中的应用研究,TP391.41
税务数据仓库系统的设计与应用,TP311.13
基于概率主题模型的中文话题检测与追踪研究,TP391.1
基于主题模型的高分辨率遥感影像变化检测,TP751
基于扩展监督主题模型的高分辨率合成孔径雷达图像的分类与标注,TN957.52
监督主题模型的研究与应用,TP391.1
基于点击数据和搜索结果片断的命名实体挖掘,TP391.3
基于图像特征的车型识别,TP391.41
图像及图像序列上的交互抠图技术研究,TP391.41
无人驾驶智能车基于单目视觉的道路检测,TP391.41
软件缺陷自动分派研究,TP311.52
多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41