学位论文 > 优秀研究生学位论文题录展示

基于张量分解的视觉显著性算法研究

作 者: 李寅
导 师: 周越
学 校: 上海交通大学
专 业: 模式识别与智能系统
关键词: 视觉显著性 张量分解 增量编码长度 子空间学习
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 321次
引 用: 0次
阅 读: 论文下载
 

内容摘要


注意选择机制,又称视觉显著性,是在时空域大量视觉信息中选择特定感兴趣区域的过程。视觉显著性是生物视觉系统的关键问题之一,提供了对于视觉数据的高效筛选方法。本文考察了“自下而上”的视觉显著性的计算模型。本文的重点是显著性的成因的可能解释,以及数据冗余性与视觉显著性之间的关系。本文的主要工作与创新点包括以下两点:基于增量信息的视觉显著性模型:该模型将显著性视为编码长度的直接体现,给出了影响视觉显著性的成因的一种可能解释。具体而言,本文在时空域中心邻域结构的基础上,利用限失真编码下的增量信息建立视觉显著性的计算模型,即将增量编码长度视为视觉显著性的度量。为了求解该模型,本文进一步考察了稀疏表示与限失真编码理论,在不同假设下,提出了两种高效的求解方法,即高斯条件信息熵与稀疏编码信息熵,并对其进行了广泛的实验。显著性区域检测和人眼运动预测实验结果表明,这一模型可以取得高效和可靠的视觉显著性。实验结果验证了这一模型的有效性。该部分研究内容发表于ACCV09,ICIP09。图像张量特征的分解方法及其在视觉显著性中的应用:本文提出了最优秩-稀疏张量分解方法。相比现有方法,最优秩-稀疏张量分解可以提取最优维度条件下的不变子空间,并同时分离异常模式。结合该分解方法以及图像特征的张量描述,本文提出了基于最优秩-稀疏张量分解的视觉显著性模型。本文进行了广泛的实验,实验结果表明最优秩-稀疏张量分解方法可以稳健分离不变子空间学习与异常模式,故而在包括眼动预测、前景提取、图像降噪、人脸分析等一系列实验上取得了优异的表现。该部分研究内容发表于ECCV10,ICIP10。

全文目录


摘要  3-5
ABSTRACT  5-11
第一章 绪论  11-15
  1.1 视觉显著性的计算模型概述  12-13
  1.2 图像的张量描述与分析概述  13-14
  1.3 论文的主要研究内容与章节安排  14-15
第二章 研究背景与国内外研究现状  15-19
  2.1 视觉显著性的计算模型  15-17
    2.1.1 视觉注意机制  15-16
    2.1.2 显著性的计算模型  16-17
  2.2 张量子空间学习方法  17-18
    2.2.1 向量数据的子空间学习方法  17
    2.2.2 张量数据的子空间学习方法  17-18
  2.3 本章小结  18-19
第三章 基于增量信息的显著性模型  19-34
  3.1 视觉编码方式概述  19-21
    3.1.1 独立成分分析  19-20
    3.1.2 稀疏编码  20-21
  3.2 基于增量信息的视觉显著性模型  21-24
    3.2.1 时空域中心邻域结构  22
    3.2.2 模型建立  22-24
  3.3 增量编码长度显著性模型的求解  24-27
    3.3.1 高斯条件信息熵  24-25
    3.3.2 基于稀疏编码长度的信息熵  25-26
    3.3.3 显著性物体的判定  26
    3.3.4 算法流程  26-27
  3.4 实验结果与分析  27-33
    3.4.1 数据集与评价方式  27-29
    3.4.2 参数选择  29
    3.4.3 自然图像的显著性  29-31
    3.4.4 视频序列的显著性  31-33
  3.5 本章小结  33-34
第四章 基于最优秩-稀疏张量分解的显著性模型  34-54
  4.1 张量的基本运算与分解  34-37
    4.1.1 张量的基本运算  34-35
    4.1.2 张量分解方法  35-37
  4.2 图像的张量特征描述  37-39
    4.2.1 图像特征的天然张量结构  37-38
    4.2.2 图像特征的张量组织方式  38-39
  4.3 最优秩-稀疏张量分解模型  39-45
    4.3.1 模型建立  40-42
    4.3.2 模型简化  42-43
    4.3.3 模型求解  43-45
  4.4 基于最优秩-稀疏分解的视觉显著性模型  45-47
    4.4.1 基于ICA 的图像张量化描述  45-46
    4.4.2 基于最优秩-稀疏分解的显著性模型  46-47
  4.5 实验结果与分析  47-52
    4.5.1 眼动数据的预测  48-49
    4.5.2 视频前景提取  49-50
    4.5.3 序列图像去噪  50-51
    4.5.4 人脸图像分析  51-52
  4.6 本章小结  52-54
第五章 总结与展望  54-56
  5.1 主要工作与创新点  54
  5.2 后续研究工作  54-56
参考文献  56-61
致谢  61-62
攻读硕士学位期间已发表或录用的论文  62-64

相似论文

  1. 基于稀疏非负矩阵分解的图像检索,TP391.41
  2. 贝叶斯框架下的图像显著性检测,TP391.41
  3. 社会标签推荐张量分解方法研究,TP393.09
  4. 基于最大后验概率与子空间学习的二维人脸变换,TP391.41
  5. 基于子空间学习的复杂场景多姿态人脸识别,TP391.41
  6. 基于子空间的人脸识别方法的研究,TP391.41
  7. 基于视觉注意力和形状简化的抽象化绘制方法研究,TP391.41
  8. 基于振动信号的高速铁路伤损探测方法,TN911.23
  9. 多维正弦信号参数估计算法研究,TN911.7
  10. 距离测度学习理论与应用研究,TP181
  11. 雷达辐射源个体识别中的分类器设计与子空间学习,TN974
  12. 基于子空间学习的人脸特征分析及应用,TP391.41
  13. 图像子空间聚类与分类算法研究,TP391.41
  14. 基于视觉感知的视频质量评价方法,TP391.41
  15. 非负矩阵分解问题算法的研究,O151.21
  16. 智能模式识别新方法及其应用研究,TP391.4
  17. 基于稀疏表示的协同入侵检测,TP393.08
  18. 基于自然场景统计特性的视觉显著性模型研究,TP391.41
  19. 基于MATLAB平台的2D对称和非对称应力张量可视化研究,TP391.41
  20. 基于视觉注意机制的物体显著性研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com